• Tidak ada hasil yang ditemukan

Apa itu Text Mining?

Dalam dokumen BELAJAR TENTANG DATA MINING (Halaman 100-105)

BAB 8 TEXT MINING

8.1 Apa itu Text Mining?

Text mining adalah suatu teknik komputasi dan pembelajaran mesin yang digunakan untuk mengolah dan menganalisis teks secara otomatis. Text mining bertujuan untuk mengekstrak informasi yang bermanfaat dari teks, seperti menentukan tema atau topik, mengidentifikasi entitas atau kata kunci, atau mengukur sentiment atau emosi dari teks.

Text mining menggunakan berbagai macam teknik dan algoritma, seperti pemrosesan natural language, analisis korpus, atau pembelajaran mesin, untuk mengolah dan menganalisis teks secara otomatis. Text mining juga menggunakan konsep-konsep dari linguistik komputasi, seperti tokenisasi, stemming, atau N- gram, untuk memperoleh informasi yang bermanfaat dari teks.

Text mining memiliki banyak aplikasi dan manfaat dalam berbagai bidang, seperti pemasaran, penelitian, atau pemerintahan.

Dengan text mining, dapat dilakukan berbagai macam analisis teks, seperti klasifikasi teks, cluster atau pengelompokan teks, atau sumber daya linguistik yang terkait dengan teks. Dengan demikian, text mining memiliki peran yang penting dalam mengelola dan menganalisis teks secara otomatis.

8.1.1 Terminologi

Beberapa terminologi yang sering digunakan dalam text mining adalah:

1. Corpus: Ini adalah kumpulan teks yang akan dianalisis menggunakan text mining. Corpus dapat berupa teks-teks yang terkait dengan satu topik atau tema, atau teks-teks yang dikumpulkan dari sumber-sumber yang berbeda.

2. Token: Ini adalah unit dasar dari teks yang akan dianalisis menggunakan text mining. Token biasanya merupakan kata- kata atau frasa-frasa yang terdapat dalam teks, yang akan diolah dan dianalisis secara terpisah.

3. Term: Ini adalah kata atau frasa yang terdapat dalam teks, yang akan dianalisis menggunakan text mining. Term biasanya merupakan kata-kata yang memiliki makna atau nilai informatif dalam teks, yang akan digunakan untuk mengidentifikasi tema atau topik dari teks.

4. Term frequency (tf): Ini adalah jumlah kemunculan suatu term dalam teks. Term frequency digunakan untuk mengukur seberapa sering suatu term muncul dalam teks, sehingga dapat menunjukkan kepentingan atau relevansi suatu term dalam teks.

5. Document frequency (df): Ini adalah jumlah dokumen yang mengandung suatu term dalam corpus. Document frequency digunakan untuk mengukur seberapa banyak dokumen yang mengandung suatu term, sehingga dapat menunjukkan kemunculan atau distribusi suatu term dalam corpus.

6. Inverse document frequency (idf): Ini adalah nilai logaritmik yang mengukur seberapa jarang suatu term muncul dalam corpus. Inverse document frequency digunakan untuk mengimbangi term frequency, sehingga dapat menghitung nilai informatif suatu term dalam teks.

7. N-gram: Ini adalah gabungan dari N token yang terdapat dalam teks, yang akan dianalisis menggunakan text mining. N-

gram biasanya digunakan untuk mengidentifikasi frasa-frasa yang sering muncul dalam teks, sehingga dapat membantu mengidentifikasi pola-pola yang terdapat dalam teks.

8. Stemming: Ini adalah proses mengubah kata-kata menjadi kata dasar, sehingga dapat digunakan untuk mengelompokkan kata-kata yang memiliki akar yang sama dalam teks. Stemming biasanya digunakan untuk mengurangi variasi kata-kata yang muncul.

8.1.2 Tujuan Text Mining

Tujuan utama dari text mining adalah untuk mengolah dan menganalisis teks secara otomatis menggunakan teknik-teknik komputasi dan pembelajaran mesin. Text mining bertujuan untuk mengekstrak informasi yang bermanfaat dari teks, seperti menentukan tema atau topik, mengidentifikasi entitas atau kata kunci, atau mengukur sentiment atau emosi dari teks.

Dengan text mining, dapat dilakukan berbagai macam analisis teks, seperti klasifikasi teks, cluster atau pengelompokan teks, atau sumber daya linguistik yang terkait dengan teks. Text mining juga dapat membantu mengidentifikasi pola-pola yang tidak terlihat secara manual dari teks, sehingga dapat membantu mengambil keputusan atau menemukan pola-pola yang bermanfaat dari teks.

Selain itu, text mining juga dapat membantu mengoptimalkan pencarian dan navigasi informasi di dalam teks, sehingga dapat memudahkan pengguna untuk menemukan informasi yang diinginkan dengan cepat dan tepat. Dengan demikian, text mining memiliki banyak manfaat dan tujuan yang bermanfaat dalam mengelola dan menganalisis teks secara otomatis.

8.1.3 Manfaat Text Mining

Menurut (Kwartler, 2017) ada banyak manfaat yang bisa didapatkan dari text mining yaitu:

1. Kepercayaan yang timbul antar pemangku kepentingan (stakeholders);

2. Metodologi dapat diterapkan dengan cepat;

3. Memungkinkan untuk diaudit dan diulang;

4. Text mining mengidentifikasi wawasan baru atau memperkuat persepsi yang ada berdasarkan semua informasi yang relevan.

Sedangkan Manfaat text mining secara umum meliputi:

1. Mempermudah akses terhadap informasi: Text mining membantu mengkonversi teks menjadi bentuk yang lebih mudah dianalisis dan diolah oleh mesin, sehingga mempermudah akses terhadap informasi yang terkandung dalam teks.

2. Mempercepat proses analisis: Text mining menggunakan algoritma dan teknik-teknik machine learning untuk mengekstrak informasi dari teks dengan cepat dan akurat, sehingga mempercepat proses analisis dan menghasilkan keputusan yang lebih cepat.

3. Menghasilkan analisis yang lebih akurat: Text mining menggunakan teknik-teknik natural language processing yang canggih untuk mengekstrak informasi dari teks, sehingga dapat menghasilkan analisis yang lebih akurat dan terpercaya.

4. Membantu mengambil keputusan yang lebih baik: Text mining mengekstrak informasi penting dari teks yang mungkin tidak terlihat secara visual, sehingga dapat membantu individu atau organisasi mengambil keputusan yang lebih baik berdasarkan data yang lebih lengkap dan akurat.

5. Menghasilkan pengetahuan baru: Text mining dapat mengidentifikasi pola-pola dan hubungan-hubungan yang mungkin tidak terlihat secara visual dalam teks, sehingga dapat menghasilkan pengetahuan baru yang bermanfaat bagi berbagai bidang.

8.1.4 Penggunaan Text Mining

Text mining dapat digunakan dalam berbagai bidang, termasuk : 1. Bisnis : Text mining dapat digunakan untuk mengekstrak informasi penting dari ulasan pelanggan, laporan keuangan, dan lainnya untuk membantu perusahaan mengambil keputusan yang lebih baik.

2. Kesehatan : Text mining dapat digunakan untuk mengekstrak informasi dari catatan medis, laporan klinis, dan sumber-sumber lainnya untuk membantu dokter mengambil keputusan diagnosis dan pengobatan yang lebih baik.

3. Penelitian : Text mining dapat digunakan untuk mengekstrak informasi dari artikel-artikel ilmiah, laporan penelitian, dan sumber-sumber lainnya untuk membantu peneliti menemukan pola dan hubungan yang mungkin tidak terlihat secara visual.

4. Media : Text mining dapat digunakan untuk mengekstrak informasi dari berita-berita, artikel-artikel, dan sumber- sumber lainnya untuk membantu jurnalis mengumpulkan fakta dan menulis artikel yang lebih baik.

5. Pemerintahan : Text mining dapat digunakan untuk mengekstrak informasi dari dokumen-dokumen pemerintah, laporan-laporan, dan sumber-sumber lainnya untuk membantu pemerintah membuat kebijakan yang lebih baik.

Dalam dokumen BELAJAR TENTANG DATA MINING (Halaman 100-105)