ANALISIS SENTIMEN ULASAN PADA PLATFORM LAZADA DENGAN METODE NATURAL LANGUAGE PROCESSING
(Tugas Metodologi Penelitian)
Oleh
ANNISA ZHAFIRAH
PRODI TEKNIK INFORMATIKA JURUSAN TEKNIK ELEKTRO
FAKULTAS TEKNIK UNIVERSITAS LAMPUNG
2024
BAB I. PENDAHULUAN 1.1. Latar Belakang
Perkembangan teknologi informasi dan komunikasi yang pesat dalam beberapa tahun terakhir telah membawa perubahan signifikan dalam berbagai aspek kehidupan manusia, termasuk dalam pola belanja. Dengan munculnya berbagai platform e-commerce, konsumen kini memiliki akses yang lebih mudah dan cepat untuk berbelanja berbagai produk secara online. Salah satu platform e- commerce yang telah meraih popularitas besar di Indonesia adalah Lazada.
Lazada menyediakan berbagai macam produk mulai dari elektronik, fashion, kebutuhan rumah tangga, hingga produk kecantikan, dengan menawarkan berbagai promo menarik yang dapat diakses oleh jutaan pengguna setiap harinya.
Namun, seiring dengan meningkatnya transaksi di platform e-commerce, tantangan baru pun muncul, salah satunya adalah bagaimana memahami dan mengelola ulasan atau review dari pelanggan. Ulasan pelanggan merupakan salah satu aspek penting dalam ekosistem e-commerce. Ulasan ini tidak hanya mempengaruhi keputusan pembelian calon konsumen lainnya tetapi juga memberikan umpan balik berharga bagi penjual dan platform itu sendiri mengenai kualitas produk dan layanan yang disediakan. Meski ulasan memiliki peran yang penting, banyaknya ulasan yang masuk setiap harinya membuat pengelolaan dan analisis ulasan tersebut menjadi tantangan tersendiri.
Dalam hal ini, adanya Natural Language Processing (NLP) berperan sebagai salah satu solusi yang potensial untuk mengatasi tantangan tersebut. NLP adalah cabang dari kecerdasan buatan (AI) yang berfokus pada interaksi antara komputer dan manusia melalui bahasa alami. Dengan menggunakan metode NLP, ulasan- ulasan yang masuk dapat dianalisis secara otomatis untuk menentukan sentimen yang terkandung di dalamnya, apakah positif, negatif, atau netral. Kendala utama dalam mengelola ulasan pelanggan di platform seperti Lazada adalah volume dan variasi data yang sangat besar. Ulasan dapat datang dari berbagai latar belakang pengguna dengan gaya bahasa dan ekspresi yang berbeda-beda, termasuk bahasa gaul, singkatan, dan bahkan kesalahan pengetikan. Kondisi ini menambah
kompleksitas dalam proses analisis sentimen. Disisi lain, ketepatan dan kecepatan dalam menganalisis ulasan ini sangat penting untuk dapat memberikan informasi yang berguna bagi pengambil keputusan di perusahaan serta bagi konsumen lain yang mencari referensi sebelum melakukan pembelian dalam sebuah platform.
Analisis sentimen dengan metode NLP menawarkan berbagai keunggulan.
Pertama, metode ini mampu mengolah data dalam jumlah besar secara efisien, sehingga memungkinkan analisis yang cepat dan real-time. Lalu, NLP dapat membantu mengidentifikasi pola dan tren dalam ulasan pelanggan yang mungkin tidak terlihat melalui analisis manual. Misalnya, NLP dapat digunakan untuk menemukan kata kunci atau frasa yang sering muncul dalam ulasan positif atau negatif, yang dapat memberikan wawasan tentang aspek apa dari produk atau layanan yang paling disukai atau tidak disukai oleh pelanggan.
Selain itu, penerapan analisis sentimen dengan NLP juga dapat meningkatkan pengalaman pelanggan. Dengan memahami sentimen pelanggan, perusahaan dapat melakukan perbaikan pada produk atau layanan yang mereka tawarkan, meningkatkan kepuasan pelanggan, dan pada akhirnya meningkatkan loyalitas pelanggan. Dalam konteks persaingan yang ketat di industri e-commerce, kemampuan untuk merespon secara cepat dan tepat terhadap umpan balik pelanggan menjadi salah satu faktor kunci keberhasilan. Namun, meskipun menawarkan banyak keuntungan, penerapan NLP dalam analisis sentimen ulasan pelanggan tidak bebas dari tantangan. Salah satu tantangan utama adalah keakuratan dalam mendeteksi sentimen. Bahasa alami yang digunakan dalam ulasan sering kali ambigu dan kontekstual, sehingga memerlukan algoritma untuk dapat memahami konteks dan makna sebenarnya dari kata-kata yang digunakan.
Selain itu, model NLP juga perlu terus diperbarui dan disesuaikan dengan perkembangan bahasa dan tren baru yang muncul dalam ulasan pelanggan.
Dalam penelitian ini, akan dilakukan analisis sentimen ulasan pada platform Lazada menggunakan metode NLP untuk mengklasifikasikan ulasan ke dalam beberapa kategori sentimen. Dengan demikian, penelitian ini diharapkan dapat memberikan kontribusi dalam meningkatkan pengelolaan ulasan pelanggan di platform e-commerce serta memberikan wawasan yang berguna bagi
pengembang dan pengelola platform dalam meningkatkan kualitas produk dan layanan yang mereka tawarkan. Adanya tahapan mengeksplorasi bagaimana analisis sentimen dengan metode NLP dapat diterapkan secara efektif pada platform e-commerce. Studi ini akan mencakup proses pengumpulan data ulasan dari platform Lazada, pra-pemrosesan data, implementasi algoritma NLP, serta evaluasi hasil analisis sentimen. Dengan demikian, diharapkan penelitian ini dapat memberikan acuan bagi perusahaan e-commerce untuk mengimplementasikan teknologi serupa dalam pengelolaan ulasan pelanggan.
Selain itu, penelitian ini memiliki poin manfaat untuk menambah literatur tentang penerapan NLP dalam analisis sentimen di industri e-commerce. Pada studi kasus pada platform Lazada ini diharapkan penelitian ini dapat memberikan perspektif baru dan menjadi referensi bagi penelitian-penelitian selanjutnya. Dengan demikian, analisis sentimen ulasan pada platform Lazada menggunakan metode NLP tidak hanya sejalan dengan peningkatan kinerja dan layanan di platform tersebut, tetapi memiliki implikasi yang lebih luas dalam konteks pengembangan teknologi AI untuk aplikasi praktis di berbagai sektor industri lainnya. Penelitian ini diharapkan dapat menjadi langkah awal menuju penerapan teknologi yang lebih canggih dan efisien dalam memahami dan merespon kebutuhan serta ekspektasi pelanggan, yang pada akhirnya berkontribusi pada keberhasilan jangka panjang dari platform e-commerce seperti Lazada.
1.2. Rumusan Masalah
Berdasarkan latar belakang di atas, dapat dirumuskan masalah sebagai berikut:
1) Faktor apa yang mempengaruhi penilaian analisis sentimen ulasan pelanggan pada platform Lazada menggunakan dengan pembelajaran model NLP?
2) Bagaimana algoritma model untuk distribusi sentimen ulasan pelanggan pada berbagai kategori produk di platform Lazada?
3) Bagaimana korelasi antara sentimen ulasan pelanggan dengan rating produk di platform Lazada?
1.3. Tujuan Penelitian
Tujuan dari penelitian ini adalah sebagai berikut:
1) Mengidentifikasi dan menganalisis faktor-faktor kunci yang berkontribusi terhadap implementasi model NLP untuk analisis sentimen ulasan pelanggan di Lazada.
2) Menganalisis distribusi sentimen ulasan pelanggan di berbagai kategori produk (seperti elektronik, fashion, kebutuhan rumah tangga) untuk memahami tren dan pola yang ada.
1.4. Manfaat Penelitian
Manfaat dari penelitian ini adalah sebagi berikut:
1) Mengeksplorasi hasil analisis sentimen sehingga dapat menjadi rekomendasi yang actionable untuk penjual dan pengelola platform dalam meningkatkan kualitas layanan dan produk.
2) Memudahkan pengguna dalam menilai produk atau layanan berdasarkan analisis sentimen yang ada dalam berbagai ulasan.
3) Membantu perusahaan dalam memahami dan meningkatkan kepuasan pelanggan melalui analisis emosi dalam ulasan pengguna.
1.5. Batasan Penelitian
Dalam penelitian ini, batasan masalah penelitian meliputi hal-hal sebagai berikut:
1) Penelitian ini dibatasi pada teks ulasan pengguna berbahasa Indonesia.
2) Data ulasan pengguna yang digunakan dalam penelitian ini diambil dari platform Lazada saja dan tidak mencakup semua sumber ulasan yang tersedia.
3) Penelitian ini menggunakan teknik pemodelan Natural Language Processing (NLP).
4) Analisis faktor sentimen hanya dilakukan pada beberapa kategori dengan ulasan terbanyak sebagai sample.
1.6 Sistematika Penulisan
Sistematika penulisan tugas akhir ini terdiri dari 5 (lima) bab sebagai berikut:
BAB I : PENDAHULUAN
Memuat latar belakang, permasalahan penelitian yang ada, perumusan masalah, tujuan penelitian, manfaat penelitian, dan batasan juga terdapat di bab ini.
BAB II : TINJAUAN PUSTAKA
Memuat dasar teori yang menjadi landasan dalam penelitian ini diantaranya yaitu Perancangan, Konsep AI, Natural Language Processing (NLP), Sentimen Analis, dan tools seperti VS Code.
BAB III : METODOLOGI PENELITIAN
Memuat waktu lama penelitian, tahapan penelitian. Dan metodologi yang digunakan dalam penelitian ini adalah Natural Language Processing (NLP).
BAB IV : PEMBAHASAN
Memuat hasil dan pembahasan dari analisis sentiment dengan metode NLP terhadap platform e-commerce Lazada.
BAB V : KESIMPULAN DAN SARAN
Memuat kesimpulan dari hasil penelitian yang telah dilaksanakan.
Lalu ada saran mengenai perbaikan dan pengembangan lebih lanjut terhadap sistem.
DAFTAR PUSTAKA
Memuat berbagai referensi yang digunakan pada pembuatan tugas akhir.
BAB 2. TINJAUAN PUSTAKA 2.1. Landasan Teori
2.1.1. Artificial Intellegence (AI)
Artificial Intelligence (AI) adalah cabang ilmu komputer yang berfokus pada pembuatan sistem yang dapat meniru kemampuan manusia dalam hal belajar, pengambilan keputusan, dan pemecahan masalah. AI mencakup berbagai subbidang seperti machine learning, neural networks, dan deep learning, yang masing-masing berperan penting dalam memajukan kemampuan mesin untuk memproses informasi dan membuat keputusan cerdas berdasarkan data yang tersedia. AI memiliki potensi yang luas dalam berbagai industri, termasuk e- commerce, di mana AI dapat digunakan untuk mengotomatisasi layanan pelanggan, personalisasi rekomendasi produk, dan analisis data ulasan pelanggan.
Dengan kemampuannya untuk mengolah dan menganalisis data dalam jumlah besar secara efisien, AI menjadi alat yang sangat penting bagi perusahaan dalam memahami perilaku dan preferensi pelanggan mereka secara lebih mendalam.
Dalam konteks penelitian ini, AI digunakan untuk mengimplementasikan teknik Natural Language Processing (NLP) yang bertujuan untuk menganalisis sentimen dari ulasan pelanggan di platform Lazada. Penggunaan AI dalam analisis sentimen memungkinkan untuk mengidentifikasi pola dan tren dari ulasan pelanggan secara otomatis, memberikan evaluasi bagi pengelola platform untuk meningkatkan kualitas layanan dan produk yang ditawarkan.
2.1.2. Natural Language Processing (NLP)
Natural Language Processing (NLP) adalah cabang dari AI yang berfokus pada interaksi antara komputer dan manusia melalui bahasa alami. NLP mencakup berbagai teknik dan algoritma yang memungkinkan mesin untuk memahami, menginterpretasikan, dan menghasilkan bahasa manusia dengan cara yang bermanfaat. Teknik-teknik NLP meliputi tokenisasi, stemming, lemmatization, parsing, dan analisis sentimen.
(sumber: imageNLP-google.com)
NLP telah banyak digunakan dalam berbagai aplikasi seperti mesin pencari, penerjemahan otomatis, chatbots, dan analisis sentimen ulasan pelanggan. Dengan kemampuan untuk menganalisis teks secara otomatis, NLP membantu mengidentifikasi emosi dan opini yang diekspresikan dalam teks, yang sangat berguna dalam konteks analisis sentimen.
Dalam penelitian ini, NLP digunakan untuk menganalisis ulasan pelanggan di platform Lazada. Dengan menggunakan algoritma NLP, ulasan pelanggan dapat diklasifikasikan ke dalam kategori sentimen tertentu (positif, negatif, atau netral), yang memberikan gambaran umum tentang persepsi pelanggan terhadap produk dan layanan yang ditawarkan oleh platform.
2.1.3. Sentimen Analisis
Sentimen Analisis adalah proses otomatis untuk menentukan opini, emosi, atau sikap seseorang terhadap suatu subjek tertentu melalui analisis teks. Ini sering digunakan dalam berbagai bidang seperti pemasaran, riset pasar, layanan pelanggan, dan media sosial untuk memahami sentimen publik atau persepsi terhadap produk, layanan, atau merek tertentu.
Sentimen Analisis dapat dilakukan dengan menggunakan berbagai metode, baik yang berbasis kamus (lexicon-based) maupun pembelajaran mesin (machine learning-based). Metode berbasis kamus melibatkan penggunaan daftar kata yang memiliki nilai sentimen tertentu, sedangkan metode berbasis pembelajaran mesin
melibatkan pelatihan model pada dataset berlabel untuk mengklasifikasikan sentimen teks.
Dalam konteks penelitian ini, Sentimen Analisis digunakan untuk mengevaluasi ulasan pelanggan di platform Lazada. Dengan menggunakan teknik NLP, setiap ulasan dianalisis untuk menentukan apakah sentimennya positif, negatif, atau netral. Hasil analisis ini kemudian dapat digunakan untuk memberikan wawasan tentang kepuasan pelanggan dan area yang memerlukan perbaikan.
2.1.4. E-Commerce
E-commerce, atau perdagangan elektronik, merujuk pada aktivitas jual beli barang dan jasa melalui internet. E-commerce telah mengalami pertumbuhan yang pesat dalam beberapa tahun terakhir, didorong oleh peningkatan akses internet, adopsi smartphone yang meluas, dan perubahan perilaku konsumen yang semakin nyaman dengan berbelanja online.
Platform e-commerce seperti Lazada menawarkan berbagai kemudahan bagi konsumen, termasuk kemudahan akses, beragam pilihan produk, serta transaksi yang cepat dan aman. Namun, dengan meningkatnya volume transaksi, tantangan baru muncul dalam mengelola dan memahami ulasan pelanggan yang semakin banyak dan bervariasi. Dalam penelitian ini, e-commerce menjadi konteks utama di mana analisis sentimen ulasan pelanggan dilakukan.
2.1.5. Lazada
Lazada adalah salah satu platform e-commerce terbesar di Asia Tenggara, termasuk Indonesia. Didirikan pada tahun 2012, Lazada menawarkan berbagai produk mulai dari elektronik, fashion, kebutuhan rumah tangga, hingga produk kecantikan. Dengan jutaan pengguna aktif setiap bulannya, Lazada menjadi pemain utama dalam industri e-commerce di kawasan ini. Lazada menyediakan fitur ulasan pelanggan di mana pengguna dapat memberikan feedback tentang produk yang mereka beli. Ulasan ini tidak hanya membantu calon pembeli untuk membuat keputusan yang lebih baik tetapi juga memberikan umpan balik
berharga bagi penjual dan pengelola platform mengenai kualitas produk dan layanan yang ditawarkan.
Penelitian ini berfokus pada analisis sentimen ulasan pelanggan di platform Lazada menggunakan metode NLP. Dengan menganalisis ulasan-ulasan tersebut, penelitian ini bertujuan untuk memberikan wawasan yang lebih dalam tentang persepsi pelanggan dan area yang dapat ditingkatkan, sehingga dapat meningkatkan kualitas layanan dan kepuasan pelanggan secara keseluruhan.
2.1.6. Ratings dan Ulasan
Ratings dan ulasan adalah komponen integral dari ekosistem e-commerce yang berfungsi sebagai alat komunikasi antara pelanggan dan penjual. Ratings umumnya berupa penilaian numerik (misalnya, skala 1-5 bintang) yang memberikan gambaran singkat tentang kepuasan atau kualitas suatu produk atau layanan. Ulasan adalah komentar teks yang lebih mendetail yang memungkinkan pelanggan untuk berbagi pengalaman mereka secara lebih komprehensif. Kedua elemen ini sangat penting karena membantu calon pembeli membuat keputusan yang lebih baik dengan menyediakan umpan balik dari pengguna lain yang telah mencoba produk tersebut. Selain itu, ratings dan ulasan juga memberikan informasi berharga bagi penjual mengenai kekuatan dan kelemahan produk mereka, yang dapat digunakan untuk perbaikan dan peningkatan kualitas.
Dalam konteks penelitian analisis sentimen, ulasan pelanggan memberikan data yang kaya dan beragam yang dapat dianalisis untuk memahami persepsi dan opini publik terhadap suatu produk atau layanan. Dengan metode Natural Language Processing (NLP), kita dapat mengekstrak dan mengkategorikan sentimen yang terkandung dalam ulasan-ulasan ini, baik itu positif, negatif, atau netral. Teknik- teknik seperti tokenization, stop words removal, stemming, dan lemmatization digunakan untuk memproses teks, sementara algoritma machine learning seperti Naive Bayes, SVM, atau deep learning digunakan untuk klasifikasi sentimen.
Analisis ini tidak hanya membantu dalam memahami kepuasan pelanggan tetapi juga dapat mengidentifikasi tren dan pola yang berguna untuk strategi pemasaran dan pengembangan produk.
2.2. Studi Kasus Terkait
Berdasarkan penelitian terdahulu berjudul “A Comparative Study of Sentiment Analysis Methods for Detecting Fake Reviews in E-Commerce oleh Maneerat Puttarattanamanee,dkk. (2003) ” berfokus pada deteksi ulasan palsu di platform e-commerce dengan menggunakan empat model berbeda yaitu GPT-2, NBSVM, BiLSTM, dan RoBERTa. Penelitian ini menggunakan dataset Amazon Review Data (2018) dan melatih model untuk mendeteksi ulasan palsu. Model-model tersebut dievaluasi berdasarkan akurasi, presisi, recall, dan F1-score. Dari keempat model tersebut, RoBERTa menunjukkan performa terbaik dengan akurasi 97%. Penelitian ini memiliki beberapa kelemahan. Diantaranya dataset yang digunakan mungkin tidak mewakili semua platform e-commerce dan ualasan menggunakan ulasan palsu dari komputer. Lalu, penelitian ini tidak menyebutkan langkah-langkah untuk mencegah overfitting, serta penelitian ini tidak memberikan analisis komparatif mendetail tentang mengapa satu model berkinerja lebih baik daripada yang lain.
Berdasarkan penelitian terdahulu berjudul “Analisis Sentimen Ulasan Produk di E-Commerce Bukalapak Menggunakan Natural Language Processing oleh Elsa Sera,dkk (2023).” Dalam penelitian ini data yang digunakan berasal dari berbagai kategori produk seperti pakaian, elektronik, kosmetik, dan lainnya.
Metode yang digunakan adalah TF-IDF untuk melatih model Naive Bayes.
Kelemahannya dataset yang digunakan dalam penelitian tersebut tidak seimbang, dengan 178 ulasan positif dan hanya 22 ulasan negatif, lalu model Naive Bayes yang dilatih menggunakan metode TF-IDF mencapai akurasi 88%. Namun, model ini tidak dapat memprediksi sentimen negatif dari ulasan produk secara efektif, menunjukkan keterbatasan dalam kemampuan prediksinya. Kemudian, penggunaan NLP dalam penelitian ini terutama untuk pembersihan, persiapan teks, seperti tokenisasi, normalisasi, penghapusan stopword dan sentimen ulasan dilabeli secara manual. Selain itu, penelitian ini tidak menyebutkan penggunaan validasi silang atau teknik lain untuk memastikan robustness kinerja model. Hal ini dapat mempengaruhi keandalan skor akurasi model.
Berdasarkan penelitian terdahulu berjudul “Implementasi Model Klasifikasi Sentimen Pada Review Produk Lazada Indonesia oleh Rizqia Lestika, dkk (2022).” Penelitian ini berfokus pada implementasi model klasifikasi sentimen pada ulasan produk dari Lazada Indonesia. Model dikembangkan menggunakan algoritma Multinomial Naïve Bayes dan diterapkan pada ulasan produk.
Algoritma ini menghitung frekuensi kemunculan kata dari dokumen (frekuensi istilah). Model dikembangkan melalui tahapan pengumpulan data, pra- pemrosesan data, vektorisasi, pengembangan model, dan implementasi model.
Adapun kekurangannya yaitu kurangnya Pemahaman Kontekstual dimana Algoritma Multinomial Naïve Bayes yang digunakan dalam model menghitung frekuensi kemunculan kata tetapi tidak menangkap makna atau konteks kata-kata.
Klasifikasi Biner yaitu model mengklasifikasikan ulasan ke dalam tiga kelas sentimen yaitu Positif, Netral, dan Negatif. Selain itu masih kurangnya validasi, dimana teks tidak menyebutkan teknik validasi silang atau validasi lainnya yang digunakan untuk menilai robustness model. Ini dapat memungkinkan menimbulkan pertanyaan tentang keandalan metrik kinerja model.
Berdasarkan penelitian terdahulu berjudul “Deep Learning Approaches for Accurate Sentiment Analysis of Online Consumer Feedback oleh Swathi Ganesan,dkk (2023).” yang mana berfokus pada penerapan teknik deep learning untuk analisis sentimen dari umpan balik konsumen online. Peneliti menggunakan dataset Amazon Foods Review dari repositori Kaggle, yang berisi 500.000 ulasan selama lebih dari satu dekade. Dataset ini mencakup informasi produk, informasi pengguna, peringkat, dan umpan balik. Data dibagi menjadi set pelatihan dan pengujian dalam rasio 70:30. Data pelatihan dibersihkan dan diproses sebelumnya untuk menghapus anomali, seperti nilai yang hilang. Noise dari data teks juga dihapus untuk meningkatkan kinerja klasifikasi. Tokenisasi data teks dilakukan untuk mengidentifikasi kata-kata umum yang memiliki sedikit signifikansi dalam kalimat. Peneliti menggunakan empat model untuk analisis sentiment yaitu Custom Embedding, Word2Vec, Averaging, dan GloVe. Model-model ini dilatih dan diuji, dengan model Custom Embedding mencapai akurasi tertinggi sebesar 94,79% selama fase pengujian.
BAB 3. METODOLOGI PENELITIAN 3.1. Waktu Penelitian
Penelitian ini dilaksanakan selama periode 5 bulan( (20 minggu), dimulai dari bulan November 2024 hingga Maret 2024. Seluruh kegiatan penelitian dilakukan di Laboratorium Komputer, Jurusan Teknik Elektro, Universitas Lampung.
Tempat ini dipilih karena memiliki fasilitas yang lengkap dan mendukung untuk penelitian di bidang kecerdasan buatan, machine learning, dan natural language processing, serta menyediakan akses ke sumber daya/software yang diperlukan.
Tabel 3.1 Waktu Pengerjaan Penelitian
Tahapan Kegiatan Pengerjaan
Persiapan Pengumpulan Data 3 Minggu
Pengumpulan Scrapping Data 1 Minggu
Data Storage 1 Minggu
Prapemrosesan Cleaning, Tokenizing, dsb. 2 Minggu Pelatihan Penyusunan Program & Model 4 Minggu
Evaluasi Pengujian Model 4 Minggu
Visualisasi Pembuatan Grafik dan Tabel 2 Minggu Ujian dan Laporan Akhir Penyelesaian Hasil Penelitian 3 Minggu
3.2. Alat Penelitian
Penelitian ini menggunakan berbagai hardware dan software sebagai berikut:
Tabel 3.2.a Hardware yang digunakan
Alat/Bahan Spesifikasi Kegunaan
Laptop Intel Core i7 atau setara, RAM 16 GB, 512 GB SSD, Windows 11
Sebagai platform pengembangan dan pengujian
Tabel 3.2.b Software yang digunakan
Tahapan Penelitian Software yang Digunakan
Pengumpulan Data BeautifulSoup, Scrapy, Selenium Prapemrosesan Data Python, Pandas, Numpy, NLTK, spaCy, Scikit-learn
Pelatihan Evaluasi Model Scikit-learn, TensorFlow, PyTorch Visualisasi Hasil Matplotlib, Seaborn, Plotly, Dash Dokumentasi dan
Penulisan Laporan
Microsoft Word atau LaTeX, Mendeley atau
Zotero, Jupyter Notebook Pengujian dan Validasi
Model
Cross-validation Tools, Confusion Matrix
Alat Tambahan Git, Google Colab, VS Code
3.3. Tahapan Penelitian 3.3.1. Pengumpulan Data
• Web Scraping
Mengumpulkan ulasan dari platform Lazada menggunakan teknik web scraping. Proses ini melibatkan penggunaan skrip atau alat khusus untuk mengekstrak informasi seperti teks ulasan, rating, tanggal ulasan, dan identitas produk. Untuk melakukannya, pertama-tama kita perlu mengidentifikasi struktur HTML dari halaman web Lazada yang berisi ulasan pelanggan.
Kemudian, dengan menggunakan pustaka web scraping seperti BeautifulSoup dan Selenium di Python, mengunduh konten yang relevan, dan menyimpannya dalam format yang dapat dianalisis lebih lanjut, seperti CSV atau database.
Penting untuk memperhatikan batasan penggunaan yang ditetapkan oleh Lazada dan memastikan tidak ada pelanggaran hak cipta atau privasi. Dengan mengumpulkan data ulasan yang cukup, kita dapat melanjutkan ke tahap berikutnya dalam analisis sentimen menggunakan metode NLP.
• Data Storage
Menyimpan data ulasan yang telah dikumpulkan dalam format yang sesuai (CSV, JSON, dll). Penyimpanan data yang baik melibatkan memastikan integritas dan keamanan data, termasuk validasi untuk menghindari duplikasi dan kesalahan, serta mengatur mekanisme pencadangan untuk mencegah kehilangan data.
3.3.2. Pra-pemrosesan Data
• Data Cleaning
Menghapus karakter khusus, angka, dan tanda baca yang tidak diperlukan.
Mengatasi data duplikat dan data kosong. Dalam konteks analisis sentimen ulasan di platform Lazada, pembersihan data melibatkan penghapusan karakter khusus, angka, dan tanda baca yang tidak diperlukan, yang dapat mengganggu proses analisis. Selain itu, pembersihan data juga mencakup penghilangan data duplikat yang dapat mendistorsi hasil analisis serta penanganan data kosong yang dapat mengurangi akurasi model.
• Tokenisasi
Memecah teks ulasan menjadi unit-unit kata/token. Tokenisasi adalah proses memecah teks ulasan menjadi unit-unit kata atau token yang lebih kecil.
Dalam penelitian ini, ulasan dari platform Lazada diuraikan menjadi kata-kata individu untuk memudahkan analisis lebih lanjut. Proses ini memungkinkan pengenalan pola dan frekuensi kemunculan kata-kata tertentu dalam ulasan.
• Normalisasi
Normalisasi adalah proses mengubah semua kata menjadi bentuk dasar mereka menggunakan teknik seperti stemming atau lemmatization. Stemming mengurangi kata-kata ke akar katanya dengan memotong akhiran, sementara lemmatization mengubah kata menjadi bentuk dasar yang dikenali kamus.
• Stop Words Removal
Menghapus kata-kata umum yang tidak memberikan makna penting dalam analisis (seperti "dan", "atau", "adalah"). Dengan menghapus stop words, kita dapat fokus pada kata-kata yang lebih relevan dan bermakna dalam ulasan, yang membantu dalam meningkatkan efisiensi dan akurasi model analisis sentimen.
• Feature Extraction
Mengubah teks menjadi representasi numerik menggunakan teknik seperti TF- IDF (Term Frequency-Inverse Document Frequency) atau Word Embeddings (Word2Vec, GloVe). TF-IDF mengukur pentingnya sebuah kata dalam suatu dokumen relatif terhadap seluruh kumpulan dokumen, sementara Word Embeddings mengubah kata-kata menjadi vektor dalam ruang multidimensi yang menangkap makna semantik.
3.3.3. Pelatihan Model
• Pembagian Data
Membagi dataset menjadi data pelatihan dan data pengujian dengan perbandingan yang sesuai (misalnya, 80% untuk pelatihan dan 20% untuk pengujian). Data pelatihan digunakan untuk melatih model, memungkinkan algoritma untuk belajar pola dan karakteristik sentimen dalam ulasan. Data pengujian digunakan untuk mengevaluasi kinerja model, memastikan bahwa model tersebut mampu menggeneralisasi dengan baik terhadap data baru yang belum pernah dilihat sebelumnya.
• Pemilihan Algoritma
Memilih algoritma pembelajaran mesin yang sesuai untuk klasifikasi sentimen, seperti Naive Bayes, Support Vector Machines (SVM), atau model seperti LSTM (Long Short-Term Memory). Pemilihan algoritma adalah tahap kritis dalam analisis sentimen yang mempengaruhi akurasi dan efektivitas model.
• Pelatihan Model
Melatih model dengan data pelatihan untuk mengklasifikasikan sentimen ulasan. Dalam penelitian ini, model akan dilatih dengan data pelatihan yang telah dibersihkan dan diproses sebelumnya. Proses pelatihan melibatkan pemberian data ulasan kepada model, yang kemudian belajar mengenali pola dan karakteristik yang menunjukkan sentimen positif, negatif, atau netral.
3.3.4. Evaluasi Model
• Pengujian Model
Menguji model yang telah dilatih menggunakan data pengujian. Dalam penelitian ini, model analisis sentimen yang telah dilatih akan diuji menggunakan data pengujian, yang terdiri dari ulasan-ulasan yang tidak digunakan selama pelatihan. Proses ini melibatkan penggunaan data pengujian untuk memprediksi sentimen dan membandingkannya dengan label sentimen yang sebenarnya.
• Metode Evaluasi
Menggunakan metrik evaluasi seperti akurasi, presisi, recall, dan F1-score untuk menilai kinerja model. Dalam penelitian ini, metrik evaluasi seperti akurasi, presisi, recall, dan F1-score akan digunakan untuk menilai model.
• Analisis Kesalahan
Menganalisis kesalahan yang terjadi untuk memahami di mana model mungkin gagal dan bagaimana cara meningkatkannya. Dalam penelitian ini, analisis kesalahan akan dilakukan dengan meninjau prediksi yang salah dan mengidentifikasi pola kesalahan. Misalnya, model mungkin kesulitan mengklasifikasikan ulasan yang ambigu atau mengandung kata-kata slang yang tidak dikenal. Dengan menganalisis kesalahan, kita dapat mengidentifikasi penyebab utama kegagalan model, seperti kurangnya data pelatihan untuk kasus tertentu atau kekurangan dalam preprocessing data.
3.3.5. Visualisasi Hasil
• Pembuatan Grafik, Tabel, dan Dashboard
Menampilkan hasil analisis sentimen dalam bentuk grafik dan tabel yang mudah dipahami. Kemudian, membuat dashboard interaktif untuk memvisualisasikan hasil analisis sentimen secara real-time.
3.3.6. Penulisan Laporan dan Dokumentasi
• Penyusunan Laporan, Revisi, dan Presentasi
Menyusun laporan penelitian yang mencakup semua tahapan penelitian dari pendahuluan hingga kesimpulan. Kemudian, mengadakan sesi review dan revisi berdasarkan masukan dari pembimbing atau rekan sejawat. Terakhir menyiapkan presentasi untuk memaparkan hasil penelitian kepada dewan penguji.
3.4. Pengujian Keberasilan Visualisasi Hasil 3.4.1 Kuesioner Pengguna
Uji kuesioner dengan menyebarkan kuesioner kepada pengguna potensial untuk menilai seberapa baik visualisasi yang telah dibuat. Pertanyaan bisa mencakup aspek-aspek seperti keterbacaan, kejelasan, dan kemudahan interpretasi.
3.4.2 Usability Testing
Uji usability testing mengundang sekelompok pengguna untuk menggunakan visualisasi dan menyelesaikan tugas tertentu. Mencatat kesulitan yang dihadapi dan waktu yang dibutuhkan untuk menyelesaikan tugas.
3.4.3 Analisis Statistik
Analisis startistik dilakukan menggunakan metrik seperti waktu pemrosesan, tingkat kesalahan, dan akurasi interpretasi untuk mengevaluasi visualisasi.
DAFTAR PUSTAKA
[1] Puttarattanamanee, M., et al. (2003). A comparative study of sentiment analysis methods for detecting fake reviews in e-commerce. Journal of E- Commerce Studies, 45(3), 234-245.
[2] Sera, E., et al. (2023). Analisis sentimen ulasan produk di e-commerce Bukalapak menggunakan Natural Language Processing. Jurnal Teknologi Informasi dan Komunikasi, 17(2), 134-146.
[3] Lestika, R., et al. (2022). Implementasi model klasifikasi sentimen pada review produk Lazada Indonesia. Jurnal Sistem Informasi, 15(1), 78-89.
[4] Ganesan, S., et al. (2023). Deep learning approaches for accurate sentiment analysis of online consumer feedback. International Journal of Data Science and Analytics, 12(4), 301-315.
[5] Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis Lectures on
Human Language Technologies, 5(1), 1-167.
https://doi.org/10.2200/S00416ED1V01Y201204HLT016
[6] Pang, B., & Lee, L. (2008). Opinion mining and sentiment analysis.
Foundations and Trends in Information Retrieval, 2(1-2), 1-135.
https://doi.org/10.1561/1500000011
[7] Zhang, L., Wang, S., & Liu, B. (2018). Deep learning for sentiment analysis:
A survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 8(4), e1253. https://doi.org/10.1002/widm.1253
[8] Cambria, E., Schuller, B., Xia, Y., & Havasi, C. (2013). New avenues in opinion mining and sentiment analysis. IEEE Intelligent Systems, 28(2), 15- 21. https://doi.org/10.1109/MIS.2013.30
[9] Medhat, W., Hassan, A., & Korashy, H. (2014). Sentiment analysis algorithms and applications: A survey. Ain Shams Engineering Journal, 5(4), 1093-1113. https://doi.org/10.1016/j.asej.2014.04.011