FASHION
CLASSIFICA
TION
2008561
Krisantus
002
Apriendi Ado Tukan
2008561 038
20085610 66
William Soeparman
20085610 85
Ida Putu Ari Jayadinanta
2008561 098
KELOMPOK 4
2008561 015
I GedeTeguh Permana
Matthew Parta Gistra Silalahi
I Made Teja Sarmandana
PROBLEM SCOPING 01
.
WHAT
● Apa Masalah Utamanya?
Proses pencarian pakaian masih berbasis tekstual
● Apa faktor-faktor pendukung masalah tersebut?
Efektifitas customer pada
mencari pakaian yang diinginkan Kompleksitas data pakaian yang direpresentasikan sebagai
gambar masih kurang tepat jika dijabarkan ke dalam kata-kata.
Kapabilitas e commerce dalam memenuhi keinginan customer terhadap pakaian yang
diinginkannya
WHERE
● Di mana saja calon user mengalami masalah ini?
Di e-commerce yang
menyediakan produk pakaian dan di platform sosmed
● Pada kondisi seperti apa si calon
“customer” mengalami masalah ini?
Saat customer ingin mencari sebuah pakaian yang serupa pada fitur mesin pencarian di e commerce
WHY
● Apa nilai utama dari permasalahan ini?
E Commerce (khususnya di Indonesia) proses pencariannya masih dalam bentuk text. Hal ini menyebabkan customer kesulitan dalam mencari pakaian yang
umumnya direpresentasikan secara visual.
● Bagaimana masalah tersebut dapat diperbaiki?
Dengan implementasi sebuah mesin pencarian berbasiskan gambar
● Siapa saja yang mengalami
WHO
masalah tersebut?
Pembeli pakaian, desainer, penasihat gaya, dan penjual pakaian
● Siapa saja yang terlibat dalam masalah tersebut?
Semua orang yang ingin mencari pakaian yang sesuai
keinginannya.
DATA
ACQUISITI ON
02
.
DATA ACQUISITION
● Campuran dari Fashion MNIST dan Data Primer Fashion
● Terdiri dari 11 label data yaitu Ankle boot, bag, coat, dress, hat, pullover, sandal, shirt, sneaker, trousers, t shirt top
● Jumlah data primer : 1.100 (100 data di setiap label)
● Jumlah data fashion MNIST : 70.000 (60.000 data latih & 10.000 data uji)
● Sumber dataset primer : Kumpulan data fashion di halaman internet
● Sumber dataset fashion mnist : Kaggle (Fashion MNIST | Kaggle)
DATASET YANG DICAMPURKAN
PADA DATA LATIH
DATA
EXPLORATI ON
03
.
● Karakteristik dataset:
Unstructured data (data gambar)
● Setiap pixel merepresentasikan fitur pada gambar yang
mewakili label data
Proses Transformasi pada Training Data
Transform Data 1:● Augmentasi data (rotasi vertikal dan horizontal, affine transformasi)
● Resize ukuran data menjadi (70,70)
● Convert pixel data ke tensor Transform Data 2:
● Augmentasi data (rotasi vertikal dan horizontal)
● Resize ukuran data menjadi (70,70)
● Convert pixel data ke tensor
Proses Transformasi pada Training Data
Transform Data 3:● Resize ukuran data menjadi (70,70)
● Convert pixel data ke tensor Transform Data 4:
● Augmentasi data (random earasing untuk menghilangkan beberapa bentukan gambar)
● Resize ukuran data menjadi (70,70)
● Convert pixel data ke tensor
Test Transform Data:
● Resize ukuran data menjadi (70,70)
● Convert pixel data ke tensor
Proses
Transformasi pada
Testing Data
● Pengolahan Data menggunakan Class FashionDataset
● Memasukkan transformasi dataset ke setiap baris data
● Splitting feature image dengan label data
● Reshape setiap feature image menjadi float32 dengan ukuran (- 1,28,28)
● Convert dataset ke dalam grayscale
Visualisasi Dataset Setelah Pemrosesan
Data Gambar
MODELING 04
.
VGG
● Algoritma VGG (Visual Geometry Group)
● Arsitektur dari CNN yang terdiri ekstraksi fitur layer (convolutional dan polling layer) dan full
connected layer
Training data
Didapatkan:
● Loss yang diperoleh mengalami penurunan baik pada data training atau validasi yang
berhimpitan (good fit)
● akurasi yang dihasilkan pada training data
sebesar 97% dan validasi data sebesar 96%.
Evaluation 04
.
Akurasi
● Model sangat baik dalam mengenali label Hat namun kurang baik dalam mengenali T- shirt top dan shirt
● Pada akurasi model adalah 97%
dan pada testing adalah 95%
Classification report
● 4 yakni head menghasilkanhasil yang sangat baik
● label 9 dan 7 yakni Tshirt top dan shirt mengalami hasil yang tidak cukup baik