• Tidak ada hasil yang ditemukan

Panduan Membangun Alur Kerja KNIME untuk Pemula

N/A
N/A
Mutiah Nurbaity

Academic year: 2024

Membagikan "Panduan Membangun Alur Kerja KNIME untuk Pemula"

Copied!
2
0
0

Teks penuh

(1)

Lembar contekan: Membangun alur kerja KNIME untuk pemula

Memulai dengan Platform Analisis KNIME

• Baca panduan instalasi di knime.com/installation

MENGEKSPLORASI MENGANALISA

Pohon Keputusan:Node Learner melatih pohon keputusan C4.5 atau CART. Jendela konfigurasi mencakup opsi untuk pemangkasan, penghentian awal, pengukuran informasi, pemisahan nilai, dan banyak lagi. Node Learner dan Predictor menyediakan tampilan interaktif tempat pohon keputusan ditampilkan bersama dengan propagasi data input.

Diagram Pencar:Mewakili baris data input sebagai titik dalam plot dua dimensi. Dimensi input

(kolom) pada plot sumbu xy dan grafik

properti bisa

diubah di jendela konfigurasi atau secara interaktif dalam tampilan node.

Bagan Sinar Matahari:

Menampilkan kolom kategoris

melalui hierarki cincin.

Setiap cincin diiris menurut nilai nominal di kolom yang sesuai dan hierarki yang dipilih. Ini adalah

grafik yang kuat untuk

analisis multivariat.

Bagan Area Bertumpuk:

Merencanakan beberapa kolom data numerik di atas satu sama lain menggunakan baris sebelumnya sebagai referensi dasar. Area di antara baris diwarnai agar lebih mudah perbandingan. Bagan ini biasanya digunakan untuk

visualisasikan topik yang sedang tren.

Lihat 7 hal yang harus Anda lakukan setelah menginstal Platform Analisis KNIME di

www.knime.com/blog/seven-things-to-do-after-installing-knime

Pohon Keputusan

• Ikuti Kursus E-Learning di

www.knime.com/knime-self-paced-courses

Memahami sistem lampu lalu lintas:

k-Berarti:Menerapkan algoritma pengelompokan k-

Means. Jumlah kluster harus ditetapkan sebelum eksekusi node. Node ini membangun kluster. Node Cluster Assigner menemukan kluster terdekat dan menugaskannya ke baris data input. Karena merupakan algoritma tanpa pengawasan, pasangan node ini tidak mengikuti skema Learner - Predictor klasik.

k-Berarti

Tidak dikonfigurasi: Node belum dikonfigurasi dan tidak dapat

dijalankan dengan pengaturan saat ini Plot Garis Bagan Pai/Donat

Plot Garis:Merencanakan nilai numerik dalam kolom data (sumbu y) terhadap nilai dalam kolom referensi (sumbu x).

Titik data dihubungkan melalui garis berwarna. Jika kolom referensi pada sumbu x berisi nilai waktu yang diurutkan, plot garis secara grafis menggambarkan evolusi deret waktu.

Manajer Warna

Manajer Warna:Menetapkan properti warna ke setiap baris input berdasarkan nilai baris dalam kolom yang dipilih. Properti warna ini memengaruhi representasi grafis dalam tampilan yang akan datang.

Bagan Pai:Memvisualisasikan satu metrik agregat untuk partisi data yang berbeda dengan irisan berwarna pada lingkaran yang luasnya proporsional dengan nilai metrik. Partisi ditentukan oleh kolom kategoris.

Dikonfigurasi: Node telah dikonfigurasi dengan benar dan dapat dieksekusi kapan saja

Dieksekusi: Node telah berhasil dieksekusi dan

hasilnya dapat dilihat dan digunakan di node hilir.

Regresi Logistik:Node Learner melatih model

regresi logistik untuk memprediksi nilai target kategoris. Jendela konfigurasi mencakup opsi untuk penyelesai, pilihan fitur input, fungsi regularisasi untuk menghindari overfitting, &

banyak lagi.

Regresi Logistik

Kotak Plot Bagan Batang Bagan Batang:Memvisualisasikan satu atau beberapa metrik

agregat untuk partisi data yang berbeda dengan batang persegi panjang yang tingginya proporsional dengan nilai metrik. Partisi ditentukan oleh kolom kategoris.

Menggabungkan Penjelajah Data

Penjelajah Data:Menyediakan tampilan interaktif untuk meringkas statistik data input melalui ukuran statistik dan histogram - untuk kolom numerik dan nominal.

Kotak Alur Cerita:Memvisualisasikan kolom numerik menggunakan statistik kuartil. Perhatikan titik-titik di ujung kumis - titik-titik itu mungkin menandai outlier!

Port dinamisPort input tambahan dapat

ditambahkan dengan mengklik tiga titik di sudut kiri bawah node.

Pencetak gol

Pencetak gol:Menghitung sejumlah ukuran kinerja seperti akurasi, skor F1, atau Kappa Cohen, untuk mengukur kualitas

pengklasifikasi.

MEMBACA

Pembaca CSV Pembaca Model

Pembaca CSV:Membaca file CSV. Memiliki fungsi deteksi otomatis untuk menebak struktur file secara otomatis. Seperti pada node pembaca lainnya, mengklik tiga titik di sudut kiri bawah memungkinkan untuk menambahkan satu port input guna terhubung ke sumber data eksternal.

Pembaca Model:Membaca model pembelajaran mesin yang dihasilkan dengan salah satu node Pembelajar. Model biasanya disimpan setelah pelatihan dan digunakan kembali dalam penerapan.

Node Pembelajar:Algoritma yang diawasi dalam KNIME Analytics Platform memiliki node Pembelajar untuk melatih model pada set

pelatihan yang telah diberi label sebelumnya. Pencetak Skor Numerik Pencetak Skor Numerik:Menghitung sejumlah ukuran kesalahan numerik, seperti kesalahan akar rata-rata kuadrat, kesalahan absolut rata-rata, atau R², untuk mengukur kualitas model prediktor numerik.

Node Prediktor:Digunakan untuk menerapkan model. Dua input adalah model yang telah dilatih dan data yang akan diproses. Output berisi data asli dan prediksi model.

Pembaca Tabel

Bahasa Indonesia: Amazon.com

Autentikasi Pembaca Tabel:Membaca data dari file .table. File .table

disusun menggunakan format milik KNIME, termasuk struktur file lengkap dan dioptimalkan untuk ruang dan kecepatan - memberikan kinerja maksimum dengan konfigurasi minimum!

Konektor Amazon S3 Pembaca CSV

Kurva ROC:Menampilkan kurva Karakteristik Operasional Penerima (ROC) dari pengklasifikasi yang bekerja pada masalah kelas biner. Salah satu dari dua kelas dipilih secara acak sebagai kelas positif dan kurva ROC dibangun berdasarkan probabilitas/skor yang dihasilkan untuk kelas tersebut pada set data masukan.

Bahasa Indonesia: AWS Kurva ROC

Pembaca Excel

Pembaca Excel:Membaca konten dari lembar dalam file Excel (XLS, XLSX). Lembar dan sel yang akan dibaca dapat ditentukan di jendela konfigurasi.

Google Lembar

Pembaca Pembaca Google Sheets:Membaca data dari file

Google Sheet. Autentikasi dilakukan di situs Google.

Kredensial Google tidak disimpan dalam alur kerja

KNIME. Integrasi ke banyak alat analisis data sumber terbuka juga tersedia.

Beberapa menggunakan GUI node KNIME (H2O, Weka, Keras, Spark MLlib). Yang lain menawarkan node dengan

lingkungan pengembangan untuk skrip dan debugging (R, Python, Java).

Pembuat Tabel

Pembuat Tabel:Memungkinkan pengguna membuat tabel data secara manual di jendela konfigurasinya sebagai lembar data. Sel data dapat disalin dan ditempel di lembar tersebut. Sempurna untuk menghasilkan kumpulan data kecil.

Pada node pembaca dan penulis, jalur file dinyatakan relatif terhadap lokasi utama instalasi KNIME saat ini, seperti alur kerja, area data alur kerja, dan titik pemasangan.

MENGUBAH

MENYEBARKAN Sumber daya

Forum KNIME:Bergabunglah dengan komunitas global kami dan terlibat dalam percakapan di forum.knime.com

Buku KNIME:Lebih banyak tips, ide, dan pelajaran dari knime.com/knimepress

Acara KNIME:Ikuti kursus, hadiri lokakarya, atau bergabung dalam pertemuan di

knime.com/pembelajaran/acara

Blog KNIME:Topik menarik, tantangan, berita industri, dan pengetahuan di knime.com/blog

Pusat KNIME:Jelajahi dan bagikan alur kerja, node, dan komponen dengan komunitas KNIME. Tambahkan peringkat atau komentar ke alur kerja lain di hub.knime.com

Panduan Lainnya:Masih menggunakan SAS atau Excel? Beralihlah ke Platform Analisis KNIME dengan panduan praktis berikut di situs web knime.com/knimepress

• Server KNIME:Untuk kolaborasi berbasis tim, otomatisasi, manajemen, dan penerapan, lihat KNIME Server di knime.com/knime-server

• Pemula

Ruang kerja aktif Pusat KNIME:Menemukan

koleksi

contoh alur kerja

menggunakan cheat ini simpul lembaran.

Kelompokkan Berdasarkan:Mengelompokkan baris-baris tabel berdasarkan nilai-nilai unik dalam kolom-kolom yang dipilih dan menghitung agregasi serta ukuran statistik untuk kelompok- kelompok yang ditentukan. Meskipun namanya sederhana, ia menawarkan fungsionalitas yang hebat dan memiliki banyak kegunaan yang tidak terduga. Misalnya - deduplikasi baris.

Data untuk Dilaporkan Data yang Akan Dilaporkan:Menandai tabel data yang akan diekspor ke BIRT

- alat pelaporan sumber terbuka sebagian yang terintegrasi dalam KNIME. Saat beralih dari KNIME ke BIRT, kumpulan data yang ditandai diimpor ke BIRT. Node Image To Report menandai gambar masukan yang akan diekspor ke BIRT.

KelompokkanOleh Rumus Matematika Rumus Matematika:Menerapkan sejumlah operasi

matematika di beberapa kolom input, dari penjumlahan dan rata-rata sederhana, hingga logaritma dan eksponensial. Semua operator Rumus Matematika juga tersedia di node Ekspresi Kolom.

Tukang kayu Tukang kayu:Menggabungkan baris dari dua tabel data

berdasarkan nilai umum dalam satu atau beberapa kolom kunci.

Jenis penggabungan yang paling umum adalah: penggabungan dalam, penggabungan luar kiri, penggabungan luar kanan, dan penggabungan luar penuh.

Penulis Excel

Memutar:Memperluas fungsionalitas agregasi node GroupBy dengan membuat tabel data keluaran dengan kolom dan baris untuk nilai unik di kolom masukan yang dipilih. Catatan: nilai unik kolom pengelompokan menjadi baris dan nilai unik kolom pivot menjadi kolom.

String ke Tanggal & Waktu

String ke Tanggal & Waktu:Mengonversi nilai dalam kolom String menjadi nilai Tanggal & Waktu. Format Tanggal &

Waktu yang terdapat dalam nilai String dapat ditentukan secara manual atau ditebak secara otomatis.

Tukang sortir

Tukang sortir:Mengurutkan tabel dalam urutan menaik atau menurun berdasarkan nilai kolom yang dipilih. Selain itu, Anda dapat mengurutkan berdasarkan beberapa kolom.

Memutar Penulis Excel (XLS):Menulis tabel data input ke lembar dalam

berkas Excel (XLS atau XLSX).

Penulis Meja Penulis Tabel:Menulis tabel data input ke dalam file menggunakan format milik KNIME yaitu .table. Format ini mencakup struktur file lengkap dan dioptimalkan untuk ruang dan kecepatan. Menyertakan struktur tabel dalam file merupakan keuntungan besar - terutama saat bertukar file data antar pengguna.

Mesin Aturan Pemisah Sel Pemisah Sel:Membagi nilai dalam kolom yang dipilih menjadi

dua atau lebih substring, sebagaimana ditentukan oleh kecocokan pembatas. Pembatas adalah karakter yang ditetapkan, seperti koma, spasi, atau karakter atau urutan karakter lainnya.

Menggabungkan Menggabungkan:Menggabungkan dua atau lebih tabel data

secara vertikal dengan menumpuk sel-sel dalam kolom dengan nama yang sama. Sel-sel dalam kolom yang tidak tumpang tindih akan diisi dengan nilai yang hilang.

Mesin Aturan:Menerapkan serangkaian aturan pada setiap baris tabel data input. Semua operator Rule

Engine juga tersedia di node Column Expressions. Penulis CSV

Penulis CSV:Menuliskan tabel data input ke dalam file CSV atau ke lokasi jarak jauh yang ditunjukkan oleh URL

Pemisahan

Pemartisian:Membagi data menjadi dua subset berdasarkan strategi pengambilan sampel. Node ini umumnya digunakan untuk menghasilkan set pelatihan dan set pengujian untuk melatih dan mengevaluasi model pembelajaran mesin.

Filter Kolom Filter Kolom:Memfilter kolom yang masuk atau keluar dari tabel data input menurut aturan pemfilteran. Kolom yang akan dipertahankan dapat dipilih secara manual menurut jenisnya, atau ekspresi regex yang sesuai dengan namanya.

Nilai yang Hilang Nilai yang Hilang:Menentukan strategi untuk menangani nilai yang hilang pada tabel data input - baik secara global pada semua kolom, atau secara individual untuk setiap kolom tunggal.

Google Lembar

Penulis

Penulis Google Sheets:Menulis tabel data input ke dalam

file Google Sheet. Autentikasi dilakukan di situs Google.

Kredensial Google tidak disimpan dalam alur kerja KNIME.

Manipulasi String

Filter Baris Manipulasi String:Melakukan operasi pada nilai

String dalam kolom, seperti menggabungkan dua atau lebih String, mengekstrak satu atau lebih substring, memangkas spasi kosong, dan sebagainya. Semua operator juga tersedia di node Ekspresi Kolom.

Filter Baris:Memfilter baris yang masuk atau keluar dari tabel data input menurut aturan pemfilteran. Aturan pemfilteran dapat mencocokkan nilai dalam kolom yang dipilih atau angka dalam rentang numerik.

Ganti Nama Kolom

Penggantian Nama Kolom:Menetapkan nama dan jenis baru ke kolom yang dipilih, seperti yang dikonfigurasi dalam dialog.

Kirim ke Tableau Pelayan

S Konektor ke Tableau:Ekspor tabel data input ke dalam file

atau server Tableau untuk pelaporan.

tinyurl.com/KNIME-Pemula

(Semua visualisasi bersifat interaktif)

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.com

(2)

Tekan KNIME

Perluas pengetahuan Anda tentang KNIME dengan koleksi buku dari KNIME Press. Untuk pengguna pemula dan lanjutan, hingga mereka yang tertarik pada topik khusus seperti deteksi topik, pencampuran data, dan solusi klasik untuk kasus penggunaan umum menggunakan KNIME Analytics Platform - ada sesuatu untuk semua orang. Tersedia untuk diunduh di www.knime.com/knimepress.

PISAU

®

PEMULA S

KEBERUNTUNGAN

Keputusan Pembelajar Pohon Pembaca Berkas Pemisahan

Pohon Keputusan Prediktor

pelatihan untuk prediksi pendapatan

Pencetak gol asli

kumpulan data

80 lawan 20

lampirkan kelas kemungkinan

matriks kebingungan + skor

Panduan Platform Analisis KNIME untuk Pemula

Penulis: Satoru Hayasaka dan Rosaria Silipo

KNIME untuk Ilmu Hayati

Kumpulan Kasus Penggunaan

Campurkan & Ubah Validasi & Terapkan

EDISI KEDUA

Pencampuran Data dengan KNIME

Model &

Membayangkan Penciptaan Produksi

Proses Produksibahasa inggris Mengkonsumsi &

Berinteraksi

Optimalkan & Tangkap Pantau & Perbarui

PISAU

®

Rosaria Silipo & Lada Rudnitckaia

© 2022 KNIME AG. Semua hak dilindungi undang-undang. KNIME®merek dagang dan logo dan TERBUKA UNTUK INOVASI®merek dagang digunakan oleh KNIME AG di bawah lisensi dari KNIME GmbH, dan terdaftar di Amerika Serikat.®juga terdaftar di Jerman.

Referensi

Dokumen terkait