• Tidak ada hasil yang ditemukan

Analisis Sentimen Ulasan pada Platform Lazada dengan Metode Natural Language Processing

N/A
N/A
Annisa Zhafirah

Academic year: 2024

Membagikan " Analisis Sentimen Ulasan pada Platform Lazada dengan Metode Natural Language Processing"

Copied!
19
0
0

Teks penuh

(1)

ANALISIS SENTIMEN ULASAN PADA PLATFORM LAZADA DENGAN METODE NATURAL LANGUAGE PROCESSING

(Tugas Metodologi Penelitian)

Oleh

ANNISA ZHAFIRAH

PRODI TEKNIK INFORMATIKA JURUSAN TEKNIK ELEKTRO

FAKULTAS TEKNIK UNIVERSITAS LAMPUNG

2024

(2)

BAB I. PENDAHULUAN 1.1. Latar Belakang

Perkembangan teknologi informasi dan komunikasi yang pesat dalam beberapa tahun terakhir telah membawa perubahan signifikan dalam berbagai aspek kehidupan manusia, termasuk dalam pola belanja. Dengan munculnya berbagai platform e-commerce, konsumen kini memiliki akses yang lebih mudah dan cepat untuk berbelanja berbagai produk secara online. Salah satu platform e- commerce yang telah meraih popularitas besar di Indonesia adalah Lazada.

Lazada menyediakan berbagai macam produk mulai dari elektronik, fashion, kebutuhan rumah tangga, hingga produk kecantikan, dengan menawarkan berbagai promo menarik yang dapat diakses oleh jutaan pengguna setiap harinya.

Namun, seiring dengan meningkatnya transaksi di platform e-commerce, tantangan baru pun muncul, salah satunya adalah bagaimana memahami dan mengelola ulasan atau review dari pelanggan. Ulasan pelanggan merupakan salah satu aspek penting dalam ekosistem e-commerce. Ulasan ini tidak hanya mempengaruhi keputusan pembelian calon konsumen lainnya tetapi juga memberikan umpan balik berharga bagi penjual dan platform itu sendiri mengenai kualitas produk dan layanan yang disediakan. Meski ulasan memiliki peran yang penting, banyaknya ulasan yang masuk setiap harinya membuat pengelolaan dan analisis ulasan tersebut menjadi tantangan tersendiri.

Dalam hal ini, adanya Natural Language Processing (NLP) berperan sebagai salah satu solusi yang potensial untuk mengatasi tantangan tersebut. NLP adalah cabang dari kecerdasan buatan (AI) yang berfokus pada interaksi antara komputer dan manusia melalui bahasa alami. Dengan menggunakan metode NLP, ulasan- ulasan yang masuk dapat dianalisis secara otomatis untuk menentukan sentimen yang terkandung di dalamnya, apakah positif, negatif, atau netral. Kendala utama dalam mengelola ulasan pelanggan di platform seperti Lazada adalah volume dan variasi data yang sangat besar. Ulasan dapat datang dari berbagai latar belakang pengguna dengan gaya bahasa dan ekspresi yang berbeda-beda, termasuk bahasa gaul, singkatan, dan bahkan kesalahan pengetikan. Kondisi ini menambah

(3)

kompleksitas dalam proses analisis sentimen. Disisi lain, ketepatan dan kecepatan dalam menganalisis ulasan ini sangat penting untuk dapat memberikan informasi yang berguna bagi pengambil keputusan di perusahaan serta bagi konsumen lain yang mencari referensi sebelum melakukan pembelian dalam sebuah platform.

Analisis sentimen dengan metode NLP menawarkan berbagai keunggulan.

Pertama, metode ini mampu mengolah data dalam jumlah besar secara efisien, sehingga memungkinkan analisis yang cepat dan real-time. Lalu, NLP dapat membantu mengidentifikasi pola dan tren dalam ulasan pelanggan yang mungkin tidak terlihat melalui analisis manual. Misalnya, NLP dapat digunakan untuk menemukan kata kunci atau frasa yang sering muncul dalam ulasan positif atau negatif, yang dapat memberikan wawasan tentang aspek apa dari produk atau layanan yang paling disukai atau tidak disukai oleh pelanggan.

Selain itu, penerapan analisis sentimen dengan NLP juga dapat meningkatkan pengalaman pelanggan. Dengan memahami sentimen pelanggan, perusahaan dapat melakukan perbaikan pada produk atau layanan yang mereka tawarkan, meningkatkan kepuasan pelanggan, dan pada akhirnya meningkatkan loyalitas pelanggan. Dalam konteks persaingan yang ketat di industri e-commerce, kemampuan untuk merespon secara cepat dan tepat terhadap umpan balik pelanggan menjadi salah satu faktor kunci keberhasilan. Namun, meskipun menawarkan banyak keuntungan, penerapan NLP dalam analisis sentimen ulasan pelanggan tidak bebas dari tantangan. Salah satu tantangan utama adalah keakuratan dalam mendeteksi sentimen. Bahasa alami yang digunakan dalam ulasan sering kali ambigu dan kontekstual, sehingga memerlukan algoritma untuk dapat memahami konteks dan makna sebenarnya dari kata-kata yang digunakan.

Selain itu, model NLP juga perlu terus diperbarui dan disesuaikan dengan perkembangan bahasa dan tren baru yang muncul dalam ulasan pelanggan.

Dalam penelitian ini, akan dilakukan analisis sentimen ulasan pada platform Lazada menggunakan metode NLP untuk mengklasifikasikan ulasan ke dalam beberapa kategori sentimen. Dengan demikian, penelitian ini diharapkan dapat memberikan kontribusi dalam meningkatkan pengelolaan ulasan pelanggan di platform e-commerce serta memberikan wawasan yang berguna bagi

(4)

pengembang dan pengelola platform dalam meningkatkan kualitas produk dan layanan yang mereka tawarkan. Adanya tahapan mengeksplorasi bagaimana analisis sentimen dengan metode NLP dapat diterapkan secara efektif pada platform e-commerce. Studi ini akan mencakup proses pengumpulan data ulasan dari platform Lazada, pra-pemrosesan data, implementasi algoritma NLP, serta evaluasi hasil analisis sentimen. Dengan demikian, diharapkan penelitian ini dapat memberikan acuan bagi perusahaan e-commerce untuk mengimplementasikan teknologi serupa dalam pengelolaan ulasan pelanggan.

Selain itu, penelitian ini memiliki poin manfaat untuk menambah literatur tentang penerapan NLP dalam analisis sentimen di industri e-commerce. Pada studi kasus pada platform Lazada ini diharapkan penelitian ini dapat memberikan perspektif baru dan menjadi referensi bagi penelitian-penelitian selanjutnya. Dengan demikian, analisis sentimen ulasan pada platform Lazada menggunakan metode NLP tidak hanya sejalan dengan peningkatan kinerja dan layanan di platform tersebut, tetapi memiliki implikasi yang lebih luas dalam konteks pengembangan teknologi AI untuk aplikasi praktis di berbagai sektor industri lainnya. Penelitian ini diharapkan dapat menjadi langkah awal menuju penerapan teknologi yang lebih canggih dan efisien dalam memahami dan merespon kebutuhan serta ekspektasi pelanggan, yang pada akhirnya berkontribusi pada keberhasilan jangka panjang dari platform e-commerce seperti Lazada.

1.2. Rumusan Masalah

Berdasarkan latar belakang di atas, dapat dirumuskan masalah sebagai berikut:

1) Faktor apa yang mempengaruhi penilaian analisis sentimen ulasan pelanggan pada platform Lazada menggunakan dengan pembelajaran model NLP?

2) Bagaimana algoritma model untuk distribusi sentimen ulasan pelanggan pada berbagai kategori produk di platform Lazada?

3) Bagaimana korelasi antara sentimen ulasan pelanggan dengan rating produk di platform Lazada?

(5)

1.3. Tujuan Penelitian

Tujuan dari penelitian ini adalah sebagai berikut:

1) Mengidentifikasi dan menganalisis faktor-faktor kunci yang berkontribusi terhadap implementasi model NLP untuk analisis sentimen ulasan pelanggan di Lazada.

2) Menganalisis distribusi sentimen ulasan pelanggan di berbagai kategori produk (seperti elektronik, fashion, kebutuhan rumah tangga) untuk memahami tren dan pola yang ada.

1.4. Manfaat Penelitian

Manfaat dari penelitian ini adalah sebagi berikut:

1) Mengeksplorasi hasil analisis sentimen sehingga dapat menjadi rekomendasi yang actionable untuk penjual dan pengelola platform dalam meningkatkan kualitas layanan dan produk.

2) Memudahkan pengguna dalam menilai produk atau layanan berdasarkan analisis sentimen yang ada dalam berbagai ulasan.

3) Membantu perusahaan dalam memahami dan meningkatkan kepuasan pelanggan melalui analisis emosi dalam ulasan pengguna.

1.5. Batasan Penelitian

Dalam penelitian ini, batasan masalah penelitian meliputi hal-hal sebagai berikut:

1) Penelitian ini dibatasi pada teks ulasan pengguna berbahasa Indonesia.

2) Data ulasan pengguna yang digunakan dalam penelitian ini diambil dari platform Lazada saja dan tidak mencakup semua sumber ulasan yang tersedia.

3) Penelitian ini menggunakan teknik pemodelan Natural Language Processing (NLP).

4) Analisis faktor sentimen hanya dilakukan pada beberapa kategori dengan ulasan terbanyak sebagai sample.

(6)

1.6 Sistematika Penulisan

Sistematika penulisan tugas akhir ini terdiri dari 5 (lima) bab sebagai berikut:

BAB I : PENDAHULUAN

Memuat latar belakang, permasalahan penelitian yang ada, perumusan masalah, tujuan penelitian, manfaat penelitian, dan batasan juga terdapat di bab ini.

BAB II : TINJAUAN PUSTAKA

Memuat dasar teori yang menjadi landasan dalam penelitian ini diantaranya yaitu Perancangan, Konsep AI, Natural Language Processing (NLP), Sentimen Analis, dan tools seperti VS Code.

BAB III : METODOLOGI PENELITIAN

Memuat waktu lama penelitian, tahapan penelitian. Dan metodologi yang digunakan dalam penelitian ini adalah Natural Language Processing (NLP).

BAB IV : PEMBAHASAN

Memuat hasil dan pembahasan dari analisis sentiment dengan metode NLP terhadap platform e-commerce Lazada.

BAB V : KESIMPULAN DAN SARAN

Memuat kesimpulan dari hasil penelitian yang telah dilaksanakan.

Lalu ada saran mengenai perbaikan dan pengembangan lebih lanjut terhadap sistem.

DAFTAR PUSTAKA

Memuat berbagai referensi yang digunakan pada pembuatan tugas akhir.

(7)

BAB 2. TINJAUAN PUSTAKA 2.1. Landasan Teori

2.1.1. Artificial Intellegence (AI)

Artificial Intelligence (AI) adalah cabang ilmu komputer yang berfokus pada pembuatan sistem yang dapat meniru kemampuan manusia dalam hal belajar, pengambilan keputusan, dan pemecahan masalah. AI mencakup berbagai subbidang seperti machine learning, neural networks, dan deep learning, yang masing-masing berperan penting dalam memajukan kemampuan mesin untuk memproses informasi dan membuat keputusan cerdas berdasarkan data yang tersedia. AI memiliki potensi yang luas dalam berbagai industri, termasuk e- commerce, di mana AI dapat digunakan untuk mengotomatisasi layanan pelanggan, personalisasi rekomendasi produk, dan analisis data ulasan pelanggan.

Dengan kemampuannya untuk mengolah dan menganalisis data dalam jumlah besar secara efisien, AI menjadi alat yang sangat penting bagi perusahaan dalam memahami perilaku dan preferensi pelanggan mereka secara lebih mendalam.

Dalam konteks penelitian ini, AI digunakan untuk mengimplementasikan teknik Natural Language Processing (NLP) yang bertujuan untuk menganalisis sentimen dari ulasan pelanggan di platform Lazada. Penggunaan AI dalam analisis sentimen memungkinkan untuk mengidentifikasi pola dan tren dari ulasan pelanggan secara otomatis, memberikan evaluasi bagi pengelola platform untuk meningkatkan kualitas layanan dan produk yang ditawarkan.

2.1.2. Natural Language Processing (NLP)

Natural Language Processing (NLP) adalah cabang dari AI yang berfokus pada interaksi antara komputer dan manusia melalui bahasa alami. NLP mencakup berbagai teknik dan algoritma yang memungkinkan mesin untuk memahami, menginterpretasikan, dan menghasilkan bahasa manusia dengan cara yang bermanfaat. Teknik-teknik NLP meliputi tokenisasi, stemming, lemmatization, parsing, dan analisis sentimen.

(8)

(sumber: imageNLP-google.com)

NLP telah banyak digunakan dalam berbagai aplikasi seperti mesin pencari, penerjemahan otomatis, chatbots, dan analisis sentimen ulasan pelanggan. Dengan kemampuan untuk menganalisis teks secara otomatis, NLP membantu mengidentifikasi emosi dan opini yang diekspresikan dalam teks, yang sangat berguna dalam konteks analisis sentimen.

Dalam penelitian ini, NLP digunakan untuk menganalisis ulasan pelanggan di platform Lazada. Dengan menggunakan algoritma NLP, ulasan pelanggan dapat diklasifikasikan ke dalam kategori sentimen tertentu (positif, negatif, atau netral), yang memberikan gambaran umum tentang persepsi pelanggan terhadap produk dan layanan yang ditawarkan oleh platform.

2.1.3. Sentimen Analisis

Sentimen Analisis adalah proses otomatis untuk menentukan opini, emosi, atau sikap seseorang terhadap suatu subjek tertentu melalui analisis teks. Ini sering digunakan dalam berbagai bidang seperti pemasaran, riset pasar, layanan pelanggan, dan media sosial untuk memahami sentimen publik atau persepsi terhadap produk, layanan, atau merek tertentu.

Sentimen Analisis dapat dilakukan dengan menggunakan berbagai metode, baik yang berbasis kamus (lexicon-based) maupun pembelajaran mesin (machine learning-based). Metode berbasis kamus melibatkan penggunaan daftar kata yang memiliki nilai sentimen tertentu, sedangkan metode berbasis pembelajaran mesin

(9)

melibatkan pelatihan model pada dataset berlabel untuk mengklasifikasikan sentimen teks.

Dalam konteks penelitian ini, Sentimen Analisis digunakan untuk mengevaluasi ulasan pelanggan di platform Lazada. Dengan menggunakan teknik NLP, setiap ulasan dianalisis untuk menentukan apakah sentimennya positif, negatif, atau netral. Hasil analisis ini kemudian dapat digunakan untuk memberikan wawasan tentang kepuasan pelanggan dan area yang memerlukan perbaikan.

2.1.4. E-Commerce

E-commerce, atau perdagangan elektronik, merujuk pada aktivitas jual beli barang dan jasa melalui internet. E-commerce telah mengalami pertumbuhan yang pesat dalam beberapa tahun terakhir, didorong oleh peningkatan akses internet, adopsi smartphone yang meluas, dan perubahan perilaku konsumen yang semakin nyaman dengan berbelanja online.

Platform e-commerce seperti Lazada menawarkan berbagai kemudahan bagi konsumen, termasuk kemudahan akses, beragam pilihan produk, serta transaksi yang cepat dan aman. Namun, dengan meningkatnya volume transaksi, tantangan baru muncul dalam mengelola dan memahami ulasan pelanggan yang semakin banyak dan bervariasi. Dalam penelitian ini, e-commerce menjadi konteks utama di mana analisis sentimen ulasan pelanggan dilakukan.

2.1.5. Lazada

Lazada adalah salah satu platform e-commerce terbesar di Asia Tenggara, termasuk Indonesia. Didirikan pada tahun 2012, Lazada menawarkan berbagai produk mulai dari elektronik, fashion, kebutuhan rumah tangga, hingga produk kecantikan. Dengan jutaan pengguna aktif setiap bulannya, Lazada menjadi pemain utama dalam industri e-commerce di kawasan ini. Lazada menyediakan fitur ulasan pelanggan di mana pengguna dapat memberikan feedback tentang produk yang mereka beli. Ulasan ini tidak hanya membantu calon pembeli untuk membuat keputusan yang lebih baik tetapi juga memberikan umpan balik

(10)

berharga bagi penjual dan pengelola platform mengenai kualitas produk dan layanan yang ditawarkan.

Penelitian ini berfokus pada analisis sentimen ulasan pelanggan di platform Lazada menggunakan metode NLP. Dengan menganalisis ulasan-ulasan tersebut, penelitian ini bertujuan untuk memberikan wawasan yang lebih dalam tentang persepsi pelanggan dan area yang dapat ditingkatkan, sehingga dapat meningkatkan kualitas layanan dan kepuasan pelanggan secara keseluruhan.

2.1.6. Ratings dan Ulasan

Ratings dan ulasan adalah komponen integral dari ekosistem e-commerce yang berfungsi sebagai alat komunikasi antara pelanggan dan penjual. Ratings umumnya berupa penilaian numerik (misalnya, skala 1-5 bintang) yang memberikan gambaran singkat tentang kepuasan atau kualitas suatu produk atau layanan. Ulasan adalah komentar teks yang lebih mendetail yang memungkinkan pelanggan untuk berbagi pengalaman mereka secara lebih komprehensif. Kedua elemen ini sangat penting karena membantu calon pembeli membuat keputusan yang lebih baik dengan menyediakan umpan balik dari pengguna lain yang telah mencoba produk tersebut. Selain itu, ratings dan ulasan juga memberikan informasi berharga bagi penjual mengenai kekuatan dan kelemahan produk mereka, yang dapat digunakan untuk perbaikan dan peningkatan kualitas.

Dalam konteks penelitian analisis sentimen, ulasan pelanggan memberikan data yang kaya dan beragam yang dapat dianalisis untuk memahami persepsi dan opini publik terhadap suatu produk atau layanan. Dengan metode Natural Language Processing (NLP), kita dapat mengekstrak dan mengkategorikan sentimen yang terkandung dalam ulasan-ulasan ini, baik itu positif, negatif, atau netral. Teknik- teknik seperti tokenization, stop words removal, stemming, dan lemmatization digunakan untuk memproses teks, sementara algoritma machine learning seperti Naive Bayes, SVM, atau deep learning digunakan untuk klasifikasi sentimen.

Analisis ini tidak hanya membantu dalam memahami kepuasan pelanggan tetapi juga dapat mengidentifikasi tren dan pola yang berguna untuk strategi pemasaran dan pengembangan produk.

(11)

2.2. Studi Kasus Terkait

Berdasarkan penelitian terdahulu berjudul “A Comparative Study of Sentiment Analysis Methods for Detecting Fake Reviews in E-Commerce oleh Maneerat Puttarattanamanee,dkk. (2003) ” berfokus pada deteksi ulasan palsu di platform e-commerce dengan menggunakan empat model berbeda yaitu GPT-2, NBSVM, BiLSTM, dan RoBERTa. Penelitian ini menggunakan dataset Amazon Review Data (2018) dan melatih model untuk mendeteksi ulasan palsu. Model-model tersebut dievaluasi berdasarkan akurasi, presisi, recall, dan F1-score. Dari keempat model tersebut, RoBERTa menunjukkan performa terbaik dengan akurasi 97%. Penelitian ini memiliki beberapa kelemahan. Diantaranya dataset yang digunakan mungkin tidak mewakili semua platform e-commerce dan ualasan menggunakan ulasan palsu dari komputer. Lalu, penelitian ini tidak menyebutkan langkah-langkah untuk mencegah overfitting, serta penelitian ini tidak memberikan analisis komparatif mendetail tentang mengapa satu model berkinerja lebih baik daripada yang lain.

Berdasarkan penelitian terdahulu berjudul “Analisis Sentimen Ulasan Produk di E-Commerce Bukalapak Menggunakan Natural Language Processing oleh Elsa Sera,dkk (2023).” Dalam penelitian ini data yang digunakan berasal dari berbagai kategori produk seperti pakaian, elektronik, kosmetik, dan lainnya.

Metode yang digunakan adalah TF-IDF untuk melatih model Naive Bayes.

Kelemahannya dataset yang digunakan dalam penelitian tersebut tidak seimbang, dengan 178 ulasan positif dan hanya 22 ulasan negatif, lalu model Naive Bayes yang dilatih menggunakan metode TF-IDF mencapai akurasi 88%. Namun, model ini tidak dapat memprediksi sentimen negatif dari ulasan produk secara efektif, menunjukkan keterbatasan dalam kemampuan prediksinya. Kemudian, penggunaan NLP dalam penelitian ini terutama untuk pembersihan, persiapan teks, seperti tokenisasi, normalisasi, penghapusan stopword dan sentimen ulasan dilabeli secara manual. Selain itu, penelitian ini tidak menyebutkan penggunaan validasi silang atau teknik lain untuk memastikan robustness kinerja model. Hal ini dapat mempengaruhi keandalan skor akurasi model.

(12)

Berdasarkan penelitian terdahulu berjudul “Implementasi Model Klasifikasi Sentimen Pada Review Produk Lazada Indonesia oleh Rizqia Lestika, dkk (2022).” Penelitian ini berfokus pada implementasi model klasifikasi sentimen pada ulasan produk dari Lazada Indonesia. Model dikembangkan menggunakan algoritma Multinomial Naïve Bayes dan diterapkan pada ulasan produk.

Algoritma ini menghitung frekuensi kemunculan kata dari dokumen (frekuensi istilah). Model dikembangkan melalui tahapan pengumpulan data, pra- pemrosesan data, vektorisasi, pengembangan model, dan implementasi model.

Adapun kekurangannya yaitu kurangnya Pemahaman Kontekstual dimana Algoritma Multinomial Naïve Bayes yang digunakan dalam model menghitung frekuensi kemunculan kata tetapi tidak menangkap makna atau konteks kata-kata.

Klasifikasi Biner yaitu model mengklasifikasikan ulasan ke dalam tiga kelas sentimen yaitu Positif, Netral, dan Negatif. Selain itu masih kurangnya validasi, dimana teks tidak menyebutkan teknik validasi silang atau validasi lainnya yang digunakan untuk menilai robustness model. Ini dapat memungkinkan menimbulkan pertanyaan tentang keandalan metrik kinerja model.

Berdasarkan penelitian terdahulu berjudul “Deep Learning Approaches for Accurate Sentiment Analysis of Online Consumer Feedback oleh Swathi Ganesan,dkk (2023).” yang mana berfokus pada penerapan teknik deep learning untuk analisis sentimen dari umpan balik konsumen online. Peneliti menggunakan dataset Amazon Foods Review dari repositori Kaggle, yang berisi 500.000 ulasan selama lebih dari satu dekade. Dataset ini mencakup informasi produk, informasi pengguna, peringkat, dan umpan balik. Data dibagi menjadi set pelatihan dan pengujian dalam rasio 70:30. Data pelatihan dibersihkan dan diproses sebelumnya untuk menghapus anomali, seperti nilai yang hilang. Noise dari data teks juga dihapus untuk meningkatkan kinerja klasifikasi. Tokenisasi data teks dilakukan untuk mengidentifikasi kata-kata umum yang memiliki sedikit signifikansi dalam kalimat. Peneliti menggunakan empat model untuk analisis sentiment yaitu Custom Embedding, Word2Vec, Averaging, dan GloVe. Model-model ini dilatih dan diuji, dengan model Custom Embedding mencapai akurasi tertinggi sebesar 94,79% selama fase pengujian.

(13)

BAB 3. METODOLOGI PENELITIAN 3.1. Waktu Penelitian

Penelitian ini dilaksanakan selama periode 5 bulan( (20 minggu), dimulai dari bulan November 2024 hingga Maret 2024. Seluruh kegiatan penelitian dilakukan di Laboratorium Komputer, Jurusan Teknik Elektro, Universitas Lampung.

Tempat ini dipilih karena memiliki fasilitas yang lengkap dan mendukung untuk penelitian di bidang kecerdasan buatan, machine learning, dan natural language processing, serta menyediakan akses ke sumber daya/software yang diperlukan.

Tabel 3.1 Waktu Pengerjaan Penelitian

Tahapan Kegiatan Pengerjaan

Persiapan Pengumpulan Data 3 Minggu

Pengumpulan Scrapping Data 1 Minggu

Data Storage 1 Minggu

Prapemrosesan Cleaning, Tokenizing, dsb. 2 Minggu Pelatihan Penyusunan Program & Model 4 Minggu

Evaluasi Pengujian Model 4 Minggu

Visualisasi Pembuatan Grafik dan Tabel 2 Minggu Ujian dan Laporan Akhir Penyelesaian Hasil Penelitian 3 Minggu

3.2. Alat Penelitian

Penelitian ini menggunakan berbagai hardware dan software sebagai berikut:

Tabel 3.2.a Hardware yang digunakan

Alat/Bahan Spesifikasi Kegunaan

Laptop Intel Core i7 atau setara, RAM 16 GB, 512 GB SSD, Windows 11

Sebagai platform pengembangan dan pengujian

(14)

Tabel 3.2.b Software yang digunakan

Tahapan Penelitian Software yang Digunakan

Pengumpulan Data BeautifulSoup, Scrapy, Selenium Prapemrosesan Data Python, Pandas, Numpy, NLTK, spaCy, Scikit-learn

Pelatihan Evaluasi Model Scikit-learn, TensorFlow, PyTorch Visualisasi Hasil Matplotlib, Seaborn, Plotly, Dash Dokumentasi dan

Penulisan Laporan

Microsoft Word atau LaTeX, Mendeley atau

Zotero, Jupyter Notebook Pengujian dan Validasi

Model

Cross-validation Tools, Confusion Matrix

Alat Tambahan Git, Google Colab, VS Code

3.3. Tahapan Penelitian 3.3.1. Pengumpulan Data

• Web Scraping

Mengumpulkan ulasan dari platform Lazada menggunakan teknik web scraping. Proses ini melibatkan penggunaan skrip atau alat khusus untuk mengekstrak informasi seperti teks ulasan, rating, tanggal ulasan, dan identitas produk. Untuk melakukannya, pertama-tama kita perlu mengidentifikasi struktur HTML dari halaman web Lazada yang berisi ulasan pelanggan.

Kemudian, dengan menggunakan pustaka web scraping seperti BeautifulSoup dan Selenium di Python, mengunduh konten yang relevan, dan menyimpannya dalam format yang dapat dianalisis lebih lanjut, seperti CSV atau database.

Penting untuk memperhatikan batasan penggunaan yang ditetapkan oleh Lazada dan memastikan tidak ada pelanggaran hak cipta atau privasi. Dengan mengumpulkan data ulasan yang cukup, kita dapat melanjutkan ke tahap berikutnya dalam analisis sentimen menggunakan metode NLP.

(15)

• Data Storage

Menyimpan data ulasan yang telah dikumpulkan dalam format yang sesuai (CSV, JSON, dll). Penyimpanan data yang baik melibatkan memastikan integritas dan keamanan data, termasuk validasi untuk menghindari duplikasi dan kesalahan, serta mengatur mekanisme pencadangan untuk mencegah kehilangan data.

3.3.2. Pra-pemrosesan Data

• Data Cleaning

Menghapus karakter khusus, angka, dan tanda baca yang tidak diperlukan.

Mengatasi data duplikat dan data kosong. Dalam konteks analisis sentimen ulasan di platform Lazada, pembersihan data melibatkan penghapusan karakter khusus, angka, dan tanda baca yang tidak diperlukan, yang dapat mengganggu proses analisis. Selain itu, pembersihan data juga mencakup penghilangan data duplikat yang dapat mendistorsi hasil analisis serta penanganan data kosong yang dapat mengurangi akurasi model.

• Tokenisasi

Memecah teks ulasan menjadi unit-unit kata/token. Tokenisasi adalah proses memecah teks ulasan menjadi unit-unit kata atau token yang lebih kecil.

Dalam penelitian ini, ulasan dari platform Lazada diuraikan menjadi kata-kata individu untuk memudahkan analisis lebih lanjut. Proses ini memungkinkan pengenalan pola dan frekuensi kemunculan kata-kata tertentu dalam ulasan.

• Normalisasi

Normalisasi adalah proses mengubah semua kata menjadi bentuk dasar mereka menggunakan teknik seperti stemming atau lemmatization. Stemming mengurangi kata-kata ke akar katanya dengan memotong akhiran, sementara lemmatization mengubah kata menjadi bentuk dasar yang dikenali kamus.

(16)

• Stop Words Removal

Menghapus kata-kata umum yang tidak memberikan makna penting dalam analisis (seperti "dan", "atau", "adalah"). Dengan menghapus stop words, kita dapat fokus pada kata-kata yang lebih relevan dan bermakna dalam ulasan, yang membantu dalam meningkatkan efisiensi dan akurasi model analisis sentimen.

• Feature Extraction

Mengubah teks menjadi representasi numerik menggunakan teknik seperti TF- IDF (Term Frequency-Inverse Document Frequency) atau Word Embeddings (Word2Vec, GloVe). TF-IDF mengukur pentingnya sebuah kata dalam suatu dokumen relatif terhadap seluruh kumpulan dokumen, sementara Word Embeddings mengubah kata-kata menjadi vektor dalam ruang multidimensi yang menangkap makna semantik.

3.3.3. Pelatihan Model

• Pembagian Data

Membagi dataset menjadi data pelatihan dan data pengujian dengan perbandingan yang sesuai (misalnya, 80% untuk pelatihan dan 20% untuk pengujian). Data pelatihan digunakan untuk melatih model, memungkinkan algoritma untuk belajar pola dan karakteristik sentimen dalam ulasan. Data pengujian digunakan untuk mengevaluasi kinerja model, memastikan bahwa model tersebut mampu menggeneralisasi dengan baik terhadap data baru yang belum pernah dilihat sebelumnya.

• Pemilihan Algoritma

Memilih algoritma pembelajaran mesin yang sesuai untuk klasifikasi sentimen, seperti Naive Bayes, Support Vector Machines (SVM), atau model seperti LSTM (Long Short-Term Memory). Pemilihan algoritma adalah tahap kritis dalam analisis sentimen yang mempengaruhi akurasi dan efektivitas model.

(17)

• Pelatihan Model

Melatih model dengan data pelatihan untuk mengklasifikasikan sentimen ulasan. Dalam penelitian ini, model akan dilatih dengan data pelatihan yang telah dibersihkan dan diproses sebelumnya. Proses pelatihan melibatkan pemberian data ulasan kepada model, yang kemudian belajar mengenali pola dan karakteristik yang menunjukkan sentimen positif, negatif, atau netral.

3.3.4. Evaluasi Model

• Pengujian Model

Menguji model yang telah dilatih menggunakan data pengujian. Dalam penelitian ini, model analisis sentimen yang telah dilatih akan diuji menggunakan data pengujian, yang terdiri dari ulasan-ulasan yang tidak digunakan selama pelatihan. Proses ini melibatkan penggunaan data pengujian untuk memprediksi sentimen dan membandingkannya dengan label sentimen yang sebenarnya.

• Metode Evaluasi

Menggunakan metrik evaluasi seperti akurasi, presisi, recall, dan F1-score untuk menilai kinerja model. Dalam penelitian ini, metrik evaluasi seperti akurasi, presisi, recall, dan F1-score akan digunakan untuk menilai model.

• Analisis Kesalahan

Menganalisis kesalahan yang terjadi untuk memahami di mana model mungkin gagal dan bagaimana cara meningkatkannya. Dalam penelitian ini, analisis kesalahan akan dilakukan dengan meninjau prediksi yang salah dan mengidentifikasi pola kesalahan. Misalnya, model mungkin kesulitan mengklasifikasikan ulasan yang ambigu atau mengandung kata-kata slang yang tidak dikenal. Dengan menganalisis kesalahan, kita dapat mengidentifikasi penyebab utama kegagalan model, seperti kurangnya data pelatihan untuk kasus tertentu atau kekurangan dalam preprocessing data.

(18)

3.3.5. Visualisasi Hasil

• Pembuatan Grafik, Tabel, dan Dashboard

Menampilkan hasil analisis sentimen dalam bentuk grafik dan tabel yang mudah dipahami. Kemudian, membuat dashboard interaktif untuk memvisualisasikan hasil analisis sentimen secara real-time.

3.3.6. Penulisan Laporan dan Dokumentasi

• Penyusunan Laporan, Revisi, dan Presentasi

Menyusun laporan penelitian yang mencakup semua tahapan penelitian dari pendahuluan hingga kesimpulan. Kemudian, mengadakan sesi review dan revisi berdasarkan masukan dari pembimbing atau rekan sejawat. Terakhir menyiapkan presentasi untuk memaparkan hasil penelitian kepada dewan penguji.

3.4. Pengujian Keberasilan Visualisasi Hasil 3.4.1 Kuesioner Pengguna

Uji kuesioner dengan menyebarkan kuesioner kepada pengguna potensial untuk menilai seberapa baik visualisasi yang telah dibuat. Pertanyaan bisa mencakup aspek-aspek seperti keterbacaan, kejelasan, dan kemudahan interpretasi.

3.4.2 Usability Testing

Uji usability testing mengundang sekelompok pengguna untuk menggunakan visualisasi dan menyelesaikan tugas tertentu. Mencatat kesulitan yang dihadapi dan waktu yang dibutuhkan untuk menyelesaikan tugas.

3.4.3 Analisis Statistik

Analisis startistik dilakukan menggunakan metrik seperti waktu pemrosesan, tingkat kesalahan, dan akurasi interpretasi untuk mengevaluasi visualisasi.

(19)

DAFTAR PUSTAKA

[1] Puttarattanamanee, M., et al. (2003). A comparative study of sentiment analysis methods for detecting fake reviews in e-commerce. Journal of E- Commerce Studies, 45(3), 234-245.

[2] Sera, E., et al. (2023). Analisis sentimen ulasan produk di e-commerce Bukalapak menggunakan Natural Language Processing. Jurnal Teknologi Informasi dan Komunikasi, 17(2), 134-146.

[3] Lestika, R., et al. (2022). Implementasi model klasifikasi sentimen pada review produk Lazada Indonesia. Jurnal Sistem Informasi, 15(1), 78-89.

[4] Ganesan, S., et al. (2023). Deep learning approaches for accurate sentiment analysis of online consumer feedback. International Journal of Data Science and Analytics, 12(4), 301-315.

[5] Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis Lectures on

Human Language Technologies, 5(1), 1-167.

https://doi.org/10.2200/S00416ED1V01Y201204HLT016

[6] Pang, B., & Lee, L. (2008). Opinion mining and sentiment analysis.

Foundations and Trends in Information Retrieval, 2(1-2), 1-135.

https://doi.org/10.1561/1500000011

[7] Zhang, L., Wang, S., & Liu, B. (2018). Deep learning for sentiment analysis:

A survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 8(4), e1253. https://doi.org/10.1002/widm.1253

[8] Cambria, E., Schuller, B., Xia, Y., & Havasi, C. (2013). New avenues in opinion mining and sentiment analysis. IEEE Intelligent Systems, 28(2), 15- 21. https://doi.org/10.1109/MIS.2013.30

[9] Medhat, W., Hassan, A., & Korashy, H. (2014). Sentiment analysis algorithms and applications: A survey. Ain Shams Engineering Journal, 5(4), 1093-1113. https://doi.org/10.1016/j.asej.2014.04.011

Referensi

Dokumen terkait

Skripsi yang berjudul “ Analisis Sentimen Pengguna Twitter terhadap Objek Pariwisata di Indonesia menggunakan Algoritma Pengolahan Deep Natural Language dari IBM Insights

Textblob memiliki fitur-fitur dasar Natural Language Processing (NLP), dalam penelitian kali ini fitur analisis sentimen digunakan untuk melakukan klasifikasi

Berdasarkan hasil dari pengujian dan analisis dapat disimpulkan yaitu hasil accuracy tertinggi terhadap analisis sentimen pada ulasan aplikasi mobile banking dengan

Natural Language Processing merupakan suatu metode yang digunakan untuk pengolahan bahasa natural sehingga dapat dimengerti oleh komputer. Natural Language Processing akan

Analisis sentimen atau Opinion mining merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang

Untuk membantu calon konsumen dalam mengambil kesimpulan dari ulasan produk, pada penelitian ini akan dilakukan analisis sentimen menggunakan metode support vector machine dengan

Konsumen cenderung mengandalkan ulasan online sebagai sumber informasi yang dapat diandalkan dalam membuat keputusan pembelian, bahkan sejajar dengan rekomendasi pribadi dan konten

Analisis sentimen dan pemodelan topik ulasan game indie di Steam menggunakan Naïve Bayes dan LDA untuk pengembangan produk lebih