• Tidak ada hasil yang ditemukan

2 Perangkat Lunak Weka

N/A
N/A
Protected

Academic year: 2017

Membagikan "2 Perangkat Lunak Weka"

Copied!
29
0
0

Teks penuh

(1)

Perangkat Lunak - Weka*

Departemen Matematika, Universitas Indonesia – Depok 16424

Dr. rer. nat. Hendri Murfi

* Beberapa bagian dari slide ini adalah terjemahan dari slide Data Mining oleh I. H. Witten, E. Frank dan M. A. Hall

Intelligent Data Analysis (IDA) Group Intelligent Data Analysis (IDA) Group

Telp. +62-21-7862719/7863439, Fax. +62-21-7863439, Email. hendri@ui.ac.id

2

Weka

• Weka adalah perangkat lunak machine learning yang ditulis dalam bahasa Java

• Didistribusikan berdasarkan the GNU Public License

• Fitus utama:

– Memiliki fasilitas yang komprehensif untuk analisa data,

yaitu perangkat pre-processing data, algoritma pembelajaran, serta metode-metode evaluasi

– Memiliki interface grafis (GUI), termasuk untuk visualisasi

data

– Memiliki lingkungan untuk membandingkan

(2)

3

Format Data

Flat File dalam Format ARFF

@relation heart-disease-simplified

@attribute age numeric

@attribute sex { female, male}

@attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric

@attribute exercise_induced_angina { no, yes} @attribute class { present, not_present}

@data

Format Data

Flat File dalam Format ARFF

@relation heart-disease-simplified

@attribute age numeric

@attribute sex { female, male}

@attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric

@attribute exercise_induced_angina { no, yes} @attribute class { present, not_present}

(3)

5 Explorer, Experimenter, KnowledgeFlow, Simple CLI

6

GUI

(4)

7

Explorer

• Data dapat diimpor dari file dengan beberapa format, yaitu: ARFF, CSV, C4.5, Binary. Data juga dapat dibaca dari alamat URL atau dari suatu database

• Perangkat pre-processing pada Weka disebut „filters“. Weka memiliki filter yang dapat digunakan untuk:

– Diskritisasi, Normalisasi, Resampel, pemilihan atribut/fitur,

Dll

• Distribusi data dapat dilihat dengan cara melakukan visualisasi Menu Preprocess

8

Explorer

(5)

9 Menu Preprocess: Membuka Data

10

Explorer

(6)

11

Explorer

Menu Preprocess: Informasi Atribut/Fitur

12

Explorer

(7)

13 Menu Preprocess: Visualisasi Semua Atribut/Fitur

14

Explorer

(8)

15

Explorer

Menu Preprocess: Filter

16

Explorer

(9)

17 Menu Preprocess: Filter

18

Explorer

(10)

19

Explorer

Menu Preprocess: Filter

20

Explorer

(11)

21 Menu Preprocess: Filter

22

Explorer

(12)

23

Explorer

Menu Preprocess: Filter

24

Explorer

(13)

25 Menu Preprocess: Filter

26

Explorer

(14)

27

Explorer

• Classifiers pada Weka adalah model-model untuk memprediksi nilai-nilai nominal (klasifikasi) atau numerik (regresi)

• Machine learning yang diimplementasikan adalah:

– Decision tree,

instance-based classifiers

,

support vector

machines

, multi-layer perceptrons, Bayes' nets, rule, ...

• „Meta“-classifiers yang diimplemntasikan adalah:

– Filtered classifier, CVParameterselection, Gridsearch,

Boosting, ...

Menu Classify

28

Explorer

(15)

29 Menu Classify: Pemilihan Classifier

30

Explorer

(16)

31

Explorer

Menu Classify: Pemilihan Classifier

32

Explorer

(17)

33 Menu Classify: Pemilihan Model dan Kernel

34

Explorer

(18)

35

Explorer

Menu Classify: Pemilihan Skema Testing

36

Explorer

(19)

37 Menu Classify: Hasil

38

Explorer

(20)

39

Explorer

Menu Classify: Visualisasi Hasil/Error

40

Explorer

(21)

41

• Menu yang dapat digunakan untuk melakukan investigasi atribut/fitur mana yang paling berdaya guna

• Metode pemilihan atribut/fitur terdiri dari dua bagian:

– Metode evaluasi: PrincipalComponents,

LatentSemanticAnalysis, SVMAtributEval, ....

– Metode pecarian: BestFirst, RandomSearch, GeneticSearch,

RankSearch, ...

Menu Select attributes

42

Explorer

(22)

43

Explorer

• Menu yang dapat digunakan untuk melakukan investigasi atribut/fitur mana yang paling berdaya guna

• Metode pemilihan atribut/fitur terdiri dari dua bagian:

– Metode evaluasi: PrincipalComponents,

LatentSemanticAnalysis, SVMAtributEval, ....

– Metode pecarian: BestFirst, RandomSearch, GeneticSearch,

RankSearch, ...

Menu Select attributes

44

Explorer

(23)

45 Menu Select attributes: Run/Start

46

Explorer

(24)

47

Explorer

• Visualisasi dangan berguna pada machine learning pada tataran praktis, misal: membantu menentukan tingkat kesulitan dari masalah yang akan di olah

• Weka dapat melakukan visualisasi dalam bentuk satu atribut/fitur (1-d) atau pasangan atribut/fitur (2-d)

• Fasilitas lain:

– Nilai-nilai kelas yang berbeda warna

– Fungsi „zoom-in“

Menu Visualize

48

Explorer

(25)

49 Menu Visualize: Pasangan Atribut/Fitur

50

Explorer

(26)

51

Explorer

Menu Visualize: Pasangan Atribut/Fitur

52

Explorer

(27)

53 Menu Visualize: Pasangan Atribut/Fitur - „Zoom-in“

54

Explorer

(28)

55

Explorer

Menu Visualize: Pasangan Atribut/Fitur - „Zoom-in“

56

Explorer

(29)

Referensi

Dokumen terkait

Penelitian ini menggunakan iklan Pond’s karena; (1) iklan ini awalnya menayangkan tentang pemutih untuk wajah, tapi kemudian ber- kembang menjadi pemutih untuk kulit tubuh pe-

Dalam simulasi Wind Tunnel ini dilakukan studi tentang pengaruh parameter kecepatan aliran freestream, tinggi elemen kekasaran, dan kerapatan elemen kekasaran terhadap

Burung penetap seperti bondol peking (Lonchura punctulata) merupakan jenis yang paling banyak ditemui saat pengamatan. Hal ini dikarenakan terdapat habitat yang

Pasca UU Perkawinan dilakukan Judicial Review ke Mahkamah Konstitusi terkait pasal 7 ayat 1 tentang usia batas usia anak perempuan melangsungkan perkawiana, MK telah

Tekanan terhadap sebelah bawah penampung sepanjang pipa itu tetap P 1 dan tekanan dari atas tetap P 2. dengan demikian, gaya terhadap pelampung setimbang dengan berat

2 Untuk memberikan tekanan langsung pada pembuluh darah dinding uterus untuk berkontraksi, apakah saudara melakukan kompresi bimanual internal selama 5 menit. 3 Agar

dinyatakan valid dengan nilai CVR sebesar 0.99 yang berarti layak digunakan sebagai media pembelajaran materi berbagai tingkat keanekaragaman hayati Indonesia dari buah