Text Pre Processing v2 1

(1)

Text

Pre-Processing

Text

Pre-Processing

M Ali Fauzi Indriati

Sigit Adinugroho M Ali Fauzi

Indriati

(2)

Latar Belakang

(3)

Latar Belakang

_{Dokumen-dokumen} _yang _ada kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.

Tidak semua kata mencerminkan makna/ isi yang terkandung dalam sebuah dokumen.

_{Dokumen-dokumen} _yang _ada

kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.

(4)

Latar Belakang

_{Dokumen-dokumen} _yang _ada kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.

_{Tidak semua kata} _mencerminkan makna/isi yang terkandung dalam sebuah dokumen.

_{Dokumen-dokumen} _yang _ada

kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.

_{Tidak semua kata} _mencerminkan

(5)

Latar Belakang

_{Preprocessing} _diperlukan _untuk memilih kata yang akan digunakan sebagai indeks

Indeks ini adalah kata-kata yang mewakili dokumen yang nantinya digunakan untuk membuat pemodelan untuk Information Retrieval maupun aplikasi teks mining lain.aaaaaaaaa

_{Preprocessing} _diperlukan _untuk

memilih kata yang akan digunakan sebagai indeks

(6)

Latar Belakang

_{Preprocessing} _diperlukan _untuk memilih kata yang akan digunakan sebagai indeks

_Indeks _{ini adalah kata-kata yang}

mewakili dokumen yang nantinya digunakan untuk membuat pemodelan untuk Information Retrieval maupun aplikasi teks mining lain.

_{Preprocessing} _diperlukan _untuk

memilih kata yang akan digunakan sebagai indeks

_Indeks _{ini adalah kata-kata yang}

(7)

Defnisi

Defnisi Pemrosesan Teks (Text

Preprocessing) adalah suatu proses

pengubahan bentuk data yang belum terstruktur menjadi data yang

terstruktur sesuai dengan kebutuhan, untuk proses mining yang lebih lanjut

(sentiment analysis, peringkasan,

clustering dokumen, etc.).

Defnisi Pemrosesan Teks (Text Preprocessing) adalah suatu proses

pengubahan bentuk data yang belum terstruktur menjadi data yang

(8)

Singkatnya…

_{Preprocessing}_adalah_merubah_teks

menjadi term index

Tujuan: menghasilkan sebuah set term index yang bisa mewakili dokumen

menjadi term index

(9)

Singkatnya…

menjadi term index

_{Tujuan: menghasilkan sebuah set}

term index yang bisa mewakili

dokumen

menjadi term index

_{Tujuan: menghasilkan sebuah set} term index yang bisa mewakili

(10)

Langkah-langkah

Text Pre-processing

Langkah-langkah

Text Pre-processing

(11)

(12)

Langkah 1 : Parsing

_{Tulisan dalam sebuah dokumen bisa}

jadi terdiri dari berbagai macam

bahasa, character sets, dan format; Sering juga, dalam satu dokumen yang sama berisi tulisan dari beberapa

bahasa. Misal, sebuah email berbahasa Indonesia dengan lampiran PDF

berbahasa Inggris.aa

bahasa, character sets, dan format;

Sering juga, dalam satu dokumen yang sama berisi tulisan dari beberapa

bahasa. Misal, sebuah email berbahasa Indonesia dengan lampiran PDF

(13)

Langkah 1 : Parsing

_{Sering juga, dalam satu dokumen yang}

sama berisi tulisan dari beberapa bahasa. Misal, sebuah email

berbahasa Indonesia dengan lampiran PDF berbahasa Inggris.

_{Sering juga, dalam satu dokumen yang}

sama berisi tulisan dari beberapa bahasa. Misal, sebuah email

(14)

Langkah 1 : Parsing

Parsing Dokumen berurusan dengan

pengenalan dan “pemecahan”

struktur dokumen menjadi komponen-komponen terpisah. Pada langkah

preprocessing ini, kita menentukan mana yang dijadikan satu unit

dokumen;

Parsing Dokumen berurusan dengan

pengenalan dan “pemecahan”

struktur dokumen menjadi komponen-komponen terpisah. Pada langkah

preprocessing ini, kita menentukan mana yang dijadikan satu unit

(15)

Langkah 1 : Parsing

Contoh, email dengan 4 lampiran bisa dipisah menjadi 5 dokumen : 1

dokumen yang merepresentasikan isi (body) dari email dan 4 dokumen dari masing-masing lampiran

Contoh, email dengan 4 lampiran bisa dipisah menjadi 5 dokumen : 1

(16)

Langkah 1 : Parsing

_{Contoh lain, buku dengan}₁₀₀

halaman bisa dipisah menjadi 100 dokumen; masing-masing halaman menjadi 1 dokumen

Satu tweet bisa dijadikan sebagai 1

dokumen. Begitu juga dengan sebuah koemntar pada forum atau review

produk.

Satu tweet bisa dijadikan sebagai 1

dokumen. Begitu juga dengan sebuah koemntar pada forum atau review

(17)

Langkah 1 : Parsing

_Satu_tweet _{bisa dijadikan sebagai}₁

dokumen. Begitu juga dengan sebuah komentar pada forum atau review

produk.

_Satu_tweet _{bisa dijadikan sebagai}₁ dokumen. Begitu juga dengan sebuah komentar pada forum atau review

(18)

Langkah 2 : Lexical

Analysis

Langkah 2 : Lexical

Analysis

Lebih populer disebut Lexing atau

Tokenization / Tokenisasi

Lebih populer disebut Lexing atau

(19)

Langkah 2 : Lexical

Analysis

Langkah 2 : Lexical

Analysis

_Tokenisasi _adalah _proses

pemotongan string input berdasarkan tiap kata penyusunnya.

Pada prinsipnya proses ini adalah

memisahkan setiap kata yang menyusun suatu dokumen.

Pada prinsipnya proses ini adalah

memisahkan setiap kata yang

(20)

Langkah 2 : Lexical

Analysis

Langkah 2 : Lexical

Analysis

_{Pada prinsipnya proses ini adalah}

memisahkan setiap kata yang menyusun suatu dokumen.

(21)

Langkah 2 : Lexical

Analysis

Langkah 2 : Lexical

Analysis

Pada proses ini dilakukan

penghilangan angka, tanda baca dan karakter selain huruf alfabet, karena karakter-karakter tersebut dianggap sebagai pemisah kata (delimiter) dan tidak memiliki pengaruh terhadap pemrosesan teks.

Pada proses ini dilakukan

(22)

Langkah 2 : Lexical

Analysis

Langkah 2 : Lexical

Analysis

Pada tahapan ini juga dilakukan proses case folding, dimana semua huruf diubah menjadi huruf kecil.

(23)

Langkah 2 : Lexical

Analysis

Langkah 2 : Lexical

Analysis

_{Pada tahapan ini juga}_Cleaning

Cleaning adalah proses membersihkan

dokumen dari komponen-komponen

yang tidak memiliki hubungan dengan informasi yang ada pada dokumen, seperti tag html, link, dan script

Cleaning adalah proses membersihkan

dokumen dari komponen-komponen

(24)

Langkah 2 : Lexical

Analysis

Langkah 2 : Lexical

Analysis

_Cleaning _adalah _proses

membersihkan dokumen dari

komponen-komponen yang tidak

memiliki hubungan dengan informasi yang ada pada dokumen, seperti tag html, link, dan script, dsb.

_Cleaning _adalah _proses

(25)

Contoh Tokenisasi dalam

dokumen Bahasa

Indonesia

Contoh Tokenisasi dalam

dokumen Bahasa

Indonesia

(26)

Contoh Tokenisasi

Teks Bahasa Indonesia Sekarang saya sedang suka memasak. Masakan

kesukaan saya sekarang adalah nasi goreng. Cara

(27)

Langkah 3 : Stopword

Removal

Langkah 3 : Stopword

Removal

_{Disebut juga}_Filtering

Filtering adalah tahap pengambilan

dari hasil token, yaitu kata-kata apa saja yang akan digunakan untuk

merepresentasikan dokumen.

Filtering adalah tahap pengambilan

dari hasil token, yaitu kata-kata apa saja yang akan digunakan untuk

(28)

Langkah 3 : Stopword

Removal

Langkah 3 : Stopword

Removal

_Filtering_{adalah tahap}_pemilihan

kata-kata penting dari hasil token, yaitu kata-kata apa saja yang akan digunakan untuk mewakili dokumen.

_Filtering _{adalah tahap}_pemilihan

(29)

Stopword Removal : Metode

_Algoritma_stoplist

Stoplist atau stopword adalah

kata-kata yang tidak deskriptif

(tidak penting) yang dapat dibuang dengan pendekatan bag-of-words.

Stoplist atau stopword adalah kata-kata yang tidak deskriptif

(30)

Stopword Removal : Metode

_Stoplist_atau_stopword_adalah

kata-kata yang tidak deskriptif (tidak penting) yang dapat dibuang dengan pendekatan bag-of-words.

(31)

Stopword Removal : Metode

_{Kita memiliki database kumpulan}

kata-kata yang tidak deskriptif (tidak penting), kemudian kalau

hasil tokenisasi itu ada yang

merupakan kata tidak penting dalam database tersebut, maka hasil

tokenisasi itu dibuang.

kata-kata yang tidak deskriptif (tidak penting), kemudian kalau

hasil tokenisasi itu ada yang

merupakan kata tidak penting dalam database tersebut, maka hasil

(32)

Stopword Removal : Metode

_{Contoh stopwords adalah i’m, you,}

one, two, they, are, to, the, in, dst.

_{Contoh stopwords adalah i’m, you,}

(33)

Stopword Removal : Metode

Hasil Token Hasil Filtering

they

-are

-applied applied

to

-the

-words words

in

-the

(34)

Stopword Removal : Metode

_{Contoh stopwords adalah sekarang,}

saya, sedang, adalah dst.

_{Contoh stopwords adalah sekarang,}

(35)

Stopword Removal : Metode

Token Filtering

sekarang

-memasak memasak

nasi nasi

goreng goreng

adalah

-nasi nasi

(36)

Stopword Removal : Metode

_Algoritma_wordlist

Wordlist adalah kata-kata yang deskriptif (penting) yang harus

disimpan dan tidak dibuang dengan pendekatan bag-of-words.

Wordlist adalah kata-kata yang deskriptif (penting) yang harus

(37)

Stopword Removal : Metode

_Wordlist_adalah_{kata-kata yang}

deskriptif (penting) yang harus disimpan dan tidak dibuang dengan pendekatan bag-of-words.

_Wordlist_adalah_{kata-kata yang} deskriptif (penting) yang harus

(38)

Stopword Removal : Metode

kata-kata yang deskriptif

(penting), kemudian kalau hasil tokenisasi itu ada yang merupakan

kata penting dalam database tersebut, maka hasil tokenisasi itu disimpan.

_{Kita memiliki database kumpulan} kata-kata yang deskriptif

(penting), kemudian kalau hasil tokenisasi itu ada yang merupakan

(39)

Stopword Removal : Metode

_{Contoh wordlist adalah applied,}

words, texts, dst.

_{Contoh wordlist adalah applied,}

(40)

Stopword Removal : Metode

Hasil Token Hasil Filtering

they

-are

-applied applied

to

-the

-words words

in

-the

(41)

Stopword Removal :

Metode

Stopword Removal :

Metode

 _{Algoritma wordlist}

 _{Contoh wordlist adalah suka, memasak,}

masakan, dst.

 _{Algoritma wordlist}

(42)

Stopword Removal : Metode

Token Filtering

sekarang

-memasak memasak

nasi nasi

goreng goreng

adalah

-nasi nasi

(43)

Using Stop Words or

Not?

Using Stop Words or

Not?

_{Kebanyakan aplikasi text mining}

ataupun IR bisa ditingkatkan

performanya dengan penghilangan stopword.

Akan tetapi, secara umum Web search engines seperti google sebenarnya tidak menghilangkan stop word, karena

algoritma yang mereka gunakan berhasil memanfaatkan stopword dengan

baikaaa

Akan tetapi, secara umum Web search engines seperti google sebenarnya tidak menghilangkan stop word, karena

algoritma yang mereka gunakan berhasil memanfaatkan stopword dengan

(44)

Using Stop Words or

Not?

Using Stop Words or

Not?

_{Akan tetapi, secara umum Web search}

engines seperti google sebenarnya

tidak menghilangkan stop word, karena algoritma yang mereka

gunakan berhasil memanfaatkan stopword dengan baik.

_{Akan tetapi, secara umum Web search}

engines seperti google sebenarnya

tidak menghilangkan stop word, karena algoritma yang mereka

(45)

Langkah 4 :

Phrase

Detection

Langkah 4 :

Phrase

Detection

Langkah ini bisa menangkap informasi dalam teks melebihi kemampuan dari metode tokenisasi / bag-of-word murni.

(46)

Langkah 4 :

Phrase

Detection

Langkah 4 :

Phrase

Detection

Pada langkah ini tidak hanya dilakukan tokenisasi per kata, namun juga

mendeteksi adanya 2 kata atau lebih yang menjadi frase.

Pada langkah ini tidak hanya dilakukan tokenisasi per kata, namun juga

(47)

Langkah 4 :

Phrase

Detection

Langkah 4 :

Phrase

Detection

_{Contoh, dari dokumen ini :}_“search

engines are the most visible

information retrieval applications”

_{Terdapat dua buah}_frase_{, yaitu}

“search engines” dan “information retrieval”.

_{Contoh, dari dokumen ini :}_“search engines are the most visible

information retrieval applications” _{Terdapat dua buah}_frase_{, yaitu}

(48)

Langkah 4 :

Phrase

Detection

Langkah 4 :

Phrase

Detection

_{Phrase detection}_{bisa dilakukan}

dengan beberapa cara : menggunakan

rule/aturan (misal dengan

menganggap dua kata yang sering

muncul berurutan sebagai frase), bisa dengan syntactic analysis, and

kombinasi keduanya.

_{Phrase detection}_{bisa dilakukan}

dengan beberapa cara : menggunakan

rule/aturan (misal dengan

menganggap dua kata yang sering

muncul berurutan sebagai frase), bisa dengan syntactic analysis, and

(49)

Langkah 4 :

Phrase

Detection

Langkah 4 :

Phrase

Detection

_{Metode umum yang diguakan adalah}

penggunaan thesauri untuk mendeteksi adanya frase.

Contoh : Pada thesauri tersebut terdapat

daftar frase-fase dalam bahasa

tertentu, kemudia kita bandingkan kata-kata dalam teks apakah mengandung

frase-frase dalam thesauri tersebut atau tidak.aaa

_{Metode umum yang diguakan adalah} penggunaan thesauri untuk

mendeteksi adanya frase.

Contoh : Pada thesauri tersebut terdapat daftar frase-fase dalam bahasa

tertentu, kemudia kita bandingkan kata-kata dalam teks apakah mengandung

(50)

Langkah 4 :

Phrase

Detection

Langkah 4 :

Phrase

Detection

_{Metode umum yang diguakan adalah}

penggunaan thesauri untuk mendeteksi adanya frase.

_{Contoh : Pada thesauri tersebut}

terdapat daftar frase-fase dalam bahasa tertentu, kemudia kita

bandingkan kata-kata dalam teks apakah mengandung frase-frase dalam thesauri tersebut atau tidak.

_{Metode umum yang diguakan adalah} penggunaan thesauri untuk

mendeteksi adanya frase.

_{Contoh : Pada thesauri tersebut}

terdapat daftar frase-fase dalam bahasa tertentu, kemudia kita

(51)

Langkah 4 :

Phrase

Detection

Langkah 4 :

Phrase

Detection

_{Kelemahanya, tahap ini butuh}

komputasi yang cukup lama

_{Kebanyakan aplikasi teks mining atau}

IR tidak menggunakan Phrase Detection

Sudah cukup dengan Token per Kata

Akan tetapi, sebenarnya pemanfaatan

Phrase akan meningkatkan akurasi

Sudah cukup dengan Token per Kata

Akan tetapi, sebenarnya pemanfaatan

(52)

Langkah 4 :

Phrase

Detection

Langkah 4 :

Phrase

Detection

_{Sudah cukup dengan Token per Kata}

_{Akan tetapi, sebenarnya pemanfaatan}

Phrase akan meningkatkan akurasi

_{Sudah cukup dengan Token per Kata}

(53)

Langkah 5 : Stemming

Stemming adalah proses pengubahan

bentuk kata menjadi kata dasar atau tahap mencari root kata dari tiap

kata hasil fltering.

Stemming adalah proses pengubahan

bentuk kata menjadi kata dasar atau tahap mencari root kata dari tiap

(54)

Langkah 5 : Stemming

Dengan dilakukanya proses stemming setiap kata berimbuhan akan berubah menjadi kata dasar, dengan demikian

dapat lebih mengoptimalkan proses

teks mining.

Dengan dilakukanya proses stemming setiap kata berimbuhan akan berubah menjadi kata dasar, dengan demikian dapat lebih mengoptimalkan proses

(55)

Langkah 5 : Stemming

Hasil Token Hasil Filtering Hasil Stemming

they -

-are _-

-applied applied apply

to -

-the -

-words words word

in _-

-the -

(56)

Langkah 5 : Stemming

Tokensekarang Filtering- Stemming

-saya -

-sedang -

-suka suka suka

memasak memasak masak

masakan masakan masak

kesukaan kesukaan suka

saya -

-sekarang -

-adalah -

-nasi nasi nasi

goreng goreng goreng

cara

memasak memasak masak

nasi nasi nasi

goreng goreng goreng

adalah -

-nasi nasi nasi

(57)

Langkah 5 : Stemming

_{Implementasi proses} _stemming

sangat beragam , tergantung dengan

bahasa dari dokumen.

Beberapa metode untuk Stemming :

Porter Stemmer (English & Indonesia) Stemming Arifn-Setiono (Indonesia) Stemming Nazief-Adriani (Indonesia) Khoja (Arabic)

Beberapa metode untuk Stemming :

(58)

Langkah 5 : Stemming

_{Beberapa metode untuk Stemming :}

_{Porter Stemmer (English & Indonesia)} _{Stemming Arifn-Setiono (Indonesia)} _{Stemming Nazief-Adriani (Indonesia)} _{Khoja (Arabic)}

_{Beberapa metode untuk Stemming :}

(59)

Stemming : Metode

_{Algorithmic: Membuat sebuah}

algoritma yang mendeteksi imbuhan. Jika ada awalan atau

akhiran yang seperti imbuhan, maka akan dibuang.

_{Algorithmic: Membuat sebuah} algoritma yang mendeteksi imbuhan. Jika ada awalan atau

(60)

Stemming : Metode

_Algorithmic

(61)

Stemming : Metode

_{Metode Algorithmic}

_{Kelebihan : relatif}_cepat

Kekurangan : beberapa algoritma

terkadang salah mendeteksi

imbuhan, sehingga ada beberapa kata yang bukan imbuhan tapi dihilangkan

Contoh : makan -> mak; an dideteksi sebagai akhiran sehingga dibuang.

Kekurangan : beberapa algoritma terkadang salah mendeteksi

imbuhan, sehingga ada beberapa kata yang bukan imbuhan tapi dihilangkan

(62)

Stemming : Metode

_{Kekurangan : beberapa algoritma}

imbuhan, sehingga ada beberapa kata yang bukan imbuhan tapi

dihilangkan

Contoh : makan -> mak; an dideteksi sebagai akhiran sehingga dibuang.

_{Kekurangan : beberapa algoritma} terkadang salah mendeteksi

dihilangkan

(63)

Stemming : Metode

_{Kekurangan : beberapa algoritma}

dihilangkan

_{Contoh : makan -> mak;}_an_dideteksi

sebagai akhiran sehingga dibuang.

_{Kekurangan : beberapa algoritma} terkadang salah mendeteksi

dihilangkan

_{Contoh : makan -> mak;}_an_dideteksi

(64)

Stemming : Metode

_{Metode Lemmatization}

_{Lemmatization : Stemming}

berdasarkan kamus

Menggunakan vocabulary dan

morphological analysis dari kata untuk menghilangkan imbuhan dan

dikembalikan ke bentuk dasar dari kata.

Menggunakan vocabulary dan

(65)

Stemming : Metode

_Menggunakan_vocabulary_dan

dikembalikan ke bentuk dasar dari kata.

_Menggunakan_vocabulary_dan

(66)

Stemming : Metode

_{Stemming ini bagus untuk kata-kata}

yang mengalami perubahan tidak

beraturan (terutama dalam english) Contoh : “see” -> “see”, “saw”, atau “seen”

Jika ada kata “see”, “saw”, atau “seen”, bisa dikembalikan ke bentuk aslinya

yaitu “see”

yang mengalami perubahan tidak beraturan (terutama dalam english)

Contoh : “see” -> “see”, “saw”, atau “seen”

Jika ada kata “see”, “saw”, atau “seen”, bisa dikembalikan ke bentuk aslinya

(67)

Stemming : Metode

yang mengalami perubahan tidak

beraturan (terutama dalam english)

_{Contoh : “see” -> “see”, “saw”, atau}

“seen”

_{Jika ada kata “see”, “saw”, atau}

“seen”, bisa dikembalikan ke bentuk aslinya yaitu “see”

yang mengalami perubahan tidak beraturan (terutama dalam english)

_{Contoh : “see” -> “see”, “saw”, atau}

“seen”

_{Jika ada kata “see”, “saw”, atau}

(68)

Stemming : Metode

_Algoritma _Porter _Stemming

merupakan algoritma yang paling populer. Ditemukan oleh Martin Porter pada tahun 1980.

_{Mekanisme algoritma tersebut dalam}

mencari kata dasar suatu kata berimbuhan, yaitu dengan membuang imbuhan–imbuhan (atau lebih tepatnya akhiran pada kata–kata bahasa Inggris karena dalam bahasa Inggris tidak mengenal awalan).

_Algoritma _Porter _Stemming

merupakan algoritma yang paling populer. Ditemukan oleh Martin Porter pada tahun 1980.

_{Mekanisme algoritma tersebut dalam}

(69)

_{Text: “Sekarang saya sedang suka}

memasak. Masakan kesukaan saya sekarang adalah nasi goreng. Cara memasak nasi goreng adalah nasi digoreng.”

_{Text: “Sekarang saya sedang suka}

memasak. Masakan kesukaan saya sekarang adalah nasi goreng. Cara memasak nasi goreng adalah nasi digoreng.”

Tokens, Types, and Terms

(70)

Tokens, Types, and Terms

_Token_{adalah kata-kata yang}

dipisah-pisah dari teks aslinya tanpa

mempertimbangkan adanya duplikasi

Tokennya: “culo”, “dan”, “boyo”, “bermain”, “bola”, “di”, “depan”, “rumah”, “boyo”

_Token _{adalah kata-kata yang}

dipisah-pisah dari teks aslinya tanpa

mempertimbangkan adanya duplikasi

(71)

Tokens, Types, and Terms

_Type_{adalah token yang}

memperhatikan adanya duplikasi kata. Ketika ada duplikasi hanya dituliskan sekali saja.

Type: “culo”, “dan”, “boyo”, “bermain”, “bola”, “di”, “depan”, “rumah”

_Type_{adalah token yang}

memperhatikan adanya duplikasi kata. Ketika ada duplikasi hanya dituliskan sekali saja.

(72)

Tokens, Types, and Terms

_Term_{adalah type yang sudah}

dihilangkan duplikasinya dinormalisasi (dilakukan stemming, fltering, dsb)

Term : “culo”, “boyo”, “main”, “bola”, “depan”, “rumah”

_Term_{adalah type yang sudah}

dihilangkan duplikasinya dinormalisasi (dilakukan stemming, fltering, dsb)

(73)

Langkah 5 : Stemming

Hasil

Token Hasil Filtering Hasil Stemming Type Term

they - - -

-are - - -

-applied applied apply apply apply

to - - -

-the - - -

-words words word word word

in - - -

-the - - -

(74)

Langkah 5 : Stemming

Teks

Bahasa

Sekarang saya sedang suka memasak. Masakan kesukaan saya sekarang adalah nasi goreng. Cara memasak nasi goreng adalah nasi digoreng

Token Filtering Stemming Type Term

sekarang - - -

-saya - - -

-sedang - - -

-suka suka suka suka suka

memasak memasak masak masak masak

masakan masakan masak -

-kesukaan kesukaan suka -

-saya - - -

-sekarang - - -

-adalah - - -

-nasi nasi nasi nasi nasi

goreng goreng goreng goreng goreng

cara - - -

(75)

-Latihan

Latihan

 _{Tuliskan sebuah artikel satu paragraph (3-5}

kalimat) kemudian lakukan tahapan preprocessing dan tuliskan hasil akhir termnya

 _{Tuliskan sebuah artikel satu paragraph (3-5} kalimat) kemudian lakukan tahapan