• Tidak ada hasil yang ditemukan

TUGAS DATA MINING “Fetaure Engineering”

N/A
N/A
Andi Arf

Academic year: 2023

Membagikan "TUGAS DATA MINING “Fetaure Engineering”"

Copied!
4
0
0

Teks penuh

(1)

TUGAS DATA MINING

“Fetaure Engineering

Disusun Oleh:

Andi Arifai_D071201024

DOSEN:

Ir. Nurfaidah Tahir S.T., M.T., IPM

DEPARTEMEN TEKNIK INDUSTRI FAKULTAS TEKNIK UNIVERSITAS HASANUDDIN

GOWA 2023

(2)

Pentingnya Feature Engineering a. Definisi Feature Engineering

Feature Engineering (FE) adalah langkah preprocessing dalam machine learning yang digunakan untuk mengubah data mentah menjadi fitur yang dapat digunakan untuk merancang model prediktif pada machine learning atau statistical modelling. Feature Engineering juga merupakan proses menggunakan pengetahuan domain dari data dalam rangka membuat fitur yang bertujuan untuk membuat algoritma pembelajaran bekerja.

Namun, dalam rangka membangun classifier atau algoritma pembelajaran prediktif, input perlu disesuaikan sedemikian rupa sehingga algoritma dapat memahaminya. Hal tersebut memakan waktu yang cukup lama dalam proses membangun classifier. Berikut merupakan kerangka umum FE untuk klasifikasi [ CITATION Cah20 \l 1033 ].

b. Langkah-Langkah Feature Engineering

FE dilakukan setelah scrubbing dan persiapan data, tetapi sebelum menyeleksi fitur.

Urutan tersebut menunjukkan bahwa Feature Engineering (FE) memiliki peran penting dalam memberikan representasi data yang lebih baik kepada predictive learning algorithm. Feature Engineering dibagi menjadi 2 tahap, yaitu:

 Pembuatan Fitur

Merupakan proses dalam rangka menghasilkan fitur baru berdasarkan variabel yang sudah ada. Variabel yang ditentukan sebaiknya memiliki manfaat yang signifikan bagi algoritma pembelajaran prediktif.

 Transformasi Fitur

Langkah ini melibatkan penyesuaian variabel guna meningkatkan akurasi dan performa algoritma pembelajaran prediktif.

 Ekstraksi Fitur

Proses menghasilkan variabel baru dengan cara mengekstraknya dari raw data guna mengurangi volume data sehingga dapat mempermudah pengelolaan data.

 Pemilihan Fitur

Proses mengidentifikasi dan menentukan fitur yang paling sesuai dari data serta menghapus fitur yang tidak relevan atau kurang penting.

[ CITATION Cah20 \l 1033 ]

c. Pentingnya Feature Engineering

(3)

1. Rekayasa Fitur adalah langkah yang sangat penting dalam pembelajaran mesin. Rekayasa fitur mengacu pada proses merancang fitur buatan ke dalam suatu algoritma. Fitur buatan ini kemudian digunakan oleh algoritma tersebut untuk meningkatkan kinerjanya, atau dengan kata lain menuai hasil yang lebih baik. Ilmuwan data menghabiskan sebagian besar waktunya dengan data, dan penting untuk membuat model akurat. Ketika aktivitas rekayasa fitur dilakukan dengan benar, dataset yang dihasilkan optimal dan memuat semua faktor penting yang memengaruhi masalah bisnis. Sebagai hasil dari kumpulan data ini, model prediktif yang paling akurat dan wawasan yang paling berguna dihasilkan (Pathel, 2021). Beberapa contoh terkait dengan fitur engineering diantaranya adalah penerapan fitur engineering terhadap analisis kinerja teknologi augmented reality dalam target gambar. Contoh lain adalah Penggabungan Fitur (Feature Combination), menggabungkan beberapa fitur menjadi satu fitur baru yang lebih informatif. Misalnya, dalam analisis penjualan ritel, kita dapat menggabungkan fitur jumlah barang dan harga satuan untuk mendapatkan total penjualan. Ekstraksi Tanggal (Date Extraction), Jika data mencakup informasi tanggal, kita dapat mengekstrak fitur-fitur tambahan seperti hari dalam seminggu, bulan, atau musim. Hal ini dapat membantu mengungkap pola atau tren musiman dalam data.

(4)

DAFTAR PUSTAKA

Cahyani, R. R. (2020). Metode Feature Engineering dalam Performa Klasifikasi Data Mining.

SRK Jurnal, 1-3.

Pathel, Harshil. 2021. Apa itu Rekayasa Fitur- Pentingnya, Alat, dan Teknik untuk Pembelajaran Mesin. https://towardsdatascience.com/what-is-feature-engineering- importance-tools-and-techniques-for-machine-learning-2080b0269f10. Diakses pada 19 Juni 2023.

Referensi

Dokumen terkait

This project compares two different non contact reverse engineering machine available in University Technical Malaysia Melaka (UTeM) and determines which one is

Berdasarkan pada data training yang sebelumnya sudah melalui preprocessing sehingga dapat digunakan untuk membangun model Naive Bayes yaitu menyelesaikan masalah

Setelah membuat basis data, langkah selanjutnya adalah melakukan proses Extraction Transformation dan Loading (ETL). Ekstraksi adalah operasi mengekstrak data dari sistem

Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.Tahap terakhir adalah bagaimana

Algortima random forests digunakan sebagai metode klasifikasi dalam machine learning yang memiliki tahapan random feature selection, dan bootstrap aggrigation dalam

Bab ini berisi landasan teori mengenai hal-hal yang digunakan dalam penelitian, yaitu data mining, preprocessing input, penjelasan metadata, binning yang terdiri

engineering secara umum didefinisikan sebagai suatu metode yang digunakan untuk mengidentifikasi semua informasi geometri dari komponen produk kemudian mengubah

Data Mining merupakan salah satu proses, maka dipecah beberapa tahapan yaitu koleksi data, seleksi data, preprocessing, transformasi data, Data Mining yang akan digunakan adalah