Lembar contekan: Membangun alur kerja KNIME untuk pemula
Memulai dengan Platform Analisis KNIME
• Baca panduan instalasi di knime.com/installation
MENGEKSPLORASI MENGANALISA
Pohon Keputusan:Node Learner melatih pohon keputusan C4.5 atau CART. Jendela konfigurasi mencakup opsi untuk pemangkasan, penghentian awal, pengukuran informasi, pemisahan nilai, dan banyak lagi. Node Learner dan Predictor menyediakan tampilan interaktif tempat pohon keputusan ditampilkan bersama dengan propagasi data input.
Diagram Pencar:Mewakili baris data input sebagai titik dalam plot dua dimensi. Dimensi input
(kolom) pada plot sumbu xy dan grafik
properti bisa
diubah di jendela konfigurasi atau secara interaktif dalam tampilan node.
Bagan Sinar Matahari:
Menampilkan kolom kategoris
melalui hierarki cincin.
Setiap cincin diiris menurut nilai nominal di kolom yang sesuai dan hierarki yang dipilih. Ini adalah
grafik yang kuat untuk
analisis multivariat.
Bagan Area Bertumpuk:
Merencanakan beberapa kolom data numerik di atas satu sama lain menggunakan baris sebelumnya sebagai referensi dasar. Area di antara baris diwarnai agar lebih mudah perbandingan. Bagan ini biasanya digunakan untuk
visualisasikan topik yang sedang tren.
•
Lihat 7 hal yang harus Anda lakukan setelah menginstal Platform Analisis KNIME diwww.knime.com/blog/seven-things-to-do-after-installing-knime
Pohon Keputusan
• Ikuti Kursus E-Learning di
www.knime.com/knime-self-paced-courses
Memahami sistem lampu lalu lintas:
k-Berarti:Menerapkan algoritma pengelompokan k-Means. Jumlah kluster harus ditetapkan sebelum eksekusi node. Node ini membangun kluster. Node Cluster Assigner menemukan kluster terdekat dan menugaskannya ke baris data input. Karena merupakan algoritma tanpa pengawasan, pasangan node ini tidak mengikuti skema Learner - Predictor klasik.
k-Berarti
Tidak dikonfigurasi: Node belum dikonfigurasi dan tidak dapat
dijalankan dengan pengaturan saat ini Plot Garis Bagan Pai/Donat
Plot Garis:Merencanakan nilai numerik dalam kolom data (sumbu y) terhadap nilai dalam kolom referensi (sumbu x).
Titik data dihubungkan melalui garis berwarna. Jika kolom referensi pada sumbu x berisi nilai waktu yang diurutkan, plot garis secara grafis menggambarkan evolusi deret waktu.
Manajer Warna
Manajer Warna:Menetapkan properti warna ke setiap baris input berdasarkan nilai baris dalam kolom yang dipilih. Properti warna ini memengaruhi representasi grafis dalam tampilan yang akan datang.
Bagan Pai:Memvisualisasikan satu metrik agregat untuk partisi data yang berbeda dengan irisan berwarna pada lingkaran yang luasnya proporsional dengan nilai metrik. Partisi ditentukan oleh kolom kategoris.
Dikonfigurasi: Node telah dikonfigurasi dengan benar dan dapat dieksekusi kapan saja
Dieksekusi: Node telah berhasil dieksekusi dan
hasilnya dapat dilihat dan digunakan di node hilir.
Regresi Logistik:Node Learner melatih modelregresi logistik untuk memprediksi nilai target kategoris. Jendela konfigurasi mencakup opsi untuk penyelesai, pilihan fitur input, fungsi regularisasi untuk menghindari overfitting, &
banyak lagi.
Regresi Logistik
Kotak Plot Bagan Batang Bagan Batang:Memvisualisasikan satu atau beberapa metrik
agregat untuk partisi data yang berbeda dengan batang persegi panjang yang tingginya proporsional dengan nilai metrik. Partisi ditentukan oleh kolom kategoris.
Menggabungkan Penjelajah Data
Penjelajah Data:Menyediakan tampilan interaktif untuk meringkas statistik data input melalui ukuran statistik dan histogram - untuk kolom numerik dan nominal.
Kotak Alur Cerita:Memvisualisasikan kolom numerik menggunakan statistik kuartil. Perhatikan titik-titik di ujung kumis - titik-titik itu mungkin menandai outlier!
Port dinamisPort input tambahan dapat
ditambahkan dengan mengklik tiga titik di sudut kiri bawah node.
Pencetak gol
Pencetak gol:Menghitung sejumlah ukuran kinerja seperti akurasi, skor F1, atau Kappa Cohen, untuk mengukur kualitas
pengklasifikasi.
MEMBACA
Pembaca CSV Pembaca Model
Pembaca CSV:Membaca file CSV. Memiliki fungsi deteksi otomatis untuk menebak struktur file secara otomatis. Seperti pada node pembaca lainnya, mengklik tiga titik di sudut kiri bawah memungkinkan untuk menambahkan satu port input guna terhubung ke sumber data eksternal.
Pembaca Model:Membaca model pembelajaran mesin yang dihasilkan dengan salah satu node Pembelajar. Model biasanya disimpan setelah pelatihan dan digunakan kembali dalam penerapan.
Node Pembelajar:Algoritma yang diawasi dalam KNIME Analytics Platform memiliki node Pembelajar untuk melatih model pada set
pelatihan yang telah diberi label sebelumnya. Pencetak Skor Numerik Pencetak Skor Numerik:Menghitung sejumlah ukuran kesalahan numerik, seperti kesalahan akar rata-rata kuadrat, kesalahan absolut rata-rata, atau R², untuk mengukur kualitas model prediktor numerik.
Node Prediktor:Digunakan untuk menerapkan model. Dua input adalah model yang telah dilatih dan data yang akan diproses. Output berisi data asli dan prediksi model.
Pembaca Tabel
Bahasa Indonesia: Amazon.com
Autentikasi Pembaca Tabel:Membaca data dari file .table. File .table
disusun menggunakan format milik KNIME, termasuk struktur file lengkap dan dioptimalkan untuk ruang dan kecepatan - memberikan kinerja maksimum dengan konfigurasi minimum!
Konektor Amazon S3 Pembaca CSV
Kurva ROC:Menampilkan kurva Karakteristik Operasional Penerima (ROC) dari pengklasifikasi yang bekerja pada masalah kelas biner. Salah satu dari dua kelas dipilih secara acak sebagai kelas positif dan kurva ROC dibangun berdasarkan probabilitas/skor yang dihasilkan untuk kelas tersebut pada set data masukan.
Bahasa Indonesia: AWS Kurva ROC
Pembaca Excel
Pembaca Excel:Membaca konten dari lembar dalam file Excel (XLS, XLSX). Lembar dan sel yang akan dibaca dapat ditentukan di jendela konfigurasi.
Google Lembar
Pembaca Pembaca Google Sheets:Membaca data dari file
Google Sheet. Autentikasi dilakukan di situs Google.
Kredensial Google tidak disimpan dalam alur kerja
KNIME. Integrasi ke banyak alat analisis data sumber terbuka juga tersedia.
Beberapa menggunakan GUI node KNIME (H2O, Weka, Keras, Spark MLlib). Yang lain menawarkan node dengan
lingkungan pengembangan untuk skrip dan debugging (R, Python, Java).
Pembuat Tabel
Pembuat Tabel:Memungkinkan pengguna membuat tabel data secara manual di jendela konfigurasinya sebagai lembar data. Sel data dapat disalin dan ditempel di lembar tersebut. Sempurna untuk menghasilkan kumpulan data kecil.
Pada node pembaca dan penulis, jalur file dinyatakan relatif terhadap lokasi utama instalasi KNIME saat ini, seperti alur kerja, area data alur kerja, dan titik pemasangan.
MENGUBAH
MENYEBARKAN Sumber daya•
Forum KNIME:Bergabunglah dengan komunitas global kami dan terlibat dalam percakapan di forum.knime.com•
Buku KNIME:Lebih banyak tips, ide, dan pelajaran dari knime.com/knimepress•
Acara KNIME:Ikuti kursus, hadiri lokakarya, atau bergabung dalam pertemuan diknime.com/pembelajaran/acara
•
Blog KNIME:Topik menarik, tantangan, berita industri, dan pengetahuan di knime.com/blog•
Pusat KNIME:Jelajahi dan bagikan alur kerja, node, dan komponen dengan komunitas KNIME. Tambahkan peringkat atau komentar ke alur kerja lain di hub.knime.com•
Panduan Lainnya:Masih menggunakan SAS atau Excel? Beralihlah ke Platform Analisis KNIME dengan panduan praktis berikut di situs web knime.com/knimepress• Server KNIME:Untuk kolaborasi berbasis tim, otomatisasi, manajemen, dan penerapan, lihat KNIME Server di knime.com/knime-server
• Pemula
Ruang kerja aktif Pusat KNIME:Menemukankoleksi
contoh alur kerja
menggunakan cheat ini simpul lembaran.
Kelompokkan Berdasarkan:Mengelompokkan baris-baris tabel berdasarkan nilai-nilai unik dalam kolom-kolom yang dipilih dan menghitung agregasi serta ukuran statistik untuk kelompok- kelompok yang ditentukan. Meskipun namanya sederhana, ia menawarkan fungsionalitas yang hebat dan memiliki banyak kegunaan yang tidak terduga. Misalnya - deduplikasi baris.
Data untuk Dilaporkan Data yang Akan Dilaporkan:Menandai tabel data yang akan diekspor ke BIRT
- alat pelaporan sumber terbuka sebagian yang terintegrasi dalam KNIME. Saat beralih dari KNIME ke BIRT, kumpulan data yang ditandai diimpor ke BIRT. Node Image To Report menandai gambar masukan yang akan diekspor ke BIRT.
KelompokkanOleh Rumus Matematika Rumus Matematika:Menerapkan sejumlah operasi
matematika di beberapa kolom input, dari penjumlahan dan rata-rata sederhana, hingga logaritma dan eksponensial. Semua operator Rumus Matematika juga tersedia di node Ekspresi Kolom.
Tukang kayu Tukang kayu:Menggabungkan baris dari dua tabel data
berdasarkan nilai umum dalam satu atau beberapa kolom kunci.
Jenis penggabungan yang paling umum adalah: penggabungan dalam, penggabungan luar kiri, penggabungan luar kanan, dan penggabungan luar penuh.
Penulis Excel
Memutar:Memperluas fungsionalitas agregasi node GroupBy dengan membuat tabel data keluaran dengan kolom dan baris untuk nilai unik di kolom masukan yang dipilih. Catatan: nilai unik kolom pengelompokan menjadi baris dan nilai unik kolom pivot menjadi kolom.
String ke Tanggal & Waktu
String ke Tanggal & Waktu:Mengonversi nilai dalam kolom String menjadi nilai Tanggal & Waktu. Format Tanggal &
Waktu yang terdapat dalam nilai String dapat ditentukan secara manual atau ditebak secara otomatis.
Tukang sortir
Tukang sortir:Mengurutkan tabel dalam urutan menaik atau menurun berdasarkan nilai kolom yang dipilih. Selain itu, Anda dapat mengurutkan berdasarkan beberapa kolom.
Memutar Penulis Excel (XLS):Menulis tabel data input ke lembar dalam
berkas Excel (XLS atau XLSX).
Penulis Meja Penulis Tabel:Menulis tabel data input ke dalam file menggunakan format milik KNIME yaitu .table. Format ini mencakup struktur file lengkap dan dioptimalkan untuk ruang dan kecepatan. Menyertakan struktur tabel dalam file merupakan keuntungan besar - terutama saat bertukar file data antar pengguna.
Mesin Aturan Pemisah Sel Pemisah Sel:Membagi nilai dalam kolom yang dipilih menjadi
dua atau lebih substring, sebagaimana ditentukan oleh kecocokan pembatas. Pembatas adalah karakter yang ditetapkan, seperti koma, spasi, atau karakter atau urutan karakter lainnya.
Menggabungkan Menggabungkan:Menggabungkan dua atau lebih tabel data
secara vertikal dengan menumpuk sel-sel dalam kolom dengan nama yang sama. Sel-sel dalam kolom yang tidak tumpang tindih akan diisi dengan nilai yang hilang.
Mesin Aturan:Menerapkan serangkaian aturan pada setiap baris tabel data input. Semua operator Rule
Engine juga tersedia di node Column Expressions. Penulis CSV
Penulis CSV:Menuliskan tabel data input ke dalam file CSV atau ke lokasi jarak jauh yang ditunjukkan oleh URL
Pemisahan
Pemartisian:Membagi data menjadi dua subset berdasarkan strategi pengambilan sampel. Node ini umumnya digunakan untuk menghasilkan set pelatihan dan set pengujian untuk melatih dan mengevaluasi model pembelajaran mesin.
Filter Kolom Filter Kolom:Memfilter kolom yang masuk atau keluar dari tabel data input menurut aturan pemfilteran. Kolom yang akan dipertahankan dapat dipilih secara manual menurut jenisnya, atau ekspresi regex yang sesuai dengan namanya.
Nilai yang Hilang Nilai yang Hilang:Menentukan strategi untuk menangani nilai yang hilang pada tabel data input - baik secara global pada semua kolom, atau secara individual untuk setiap kolom tunggal.
Google Lembar
Penulis
Penulis Google Sheets:Menulis tabel data input ke dalam
file Google Sheet. Autentikasi dilakukan di situs Google.
Kredensial Google tidak disimpan dalam alur kerja KNIME.
Manipulasi String
Filter Baris Manipulasi String:Melakukan operasi pada nilai
String dalam kolom, seperti menggabungkan dua atau lebih String, mengekstrak satu atau lebih substring, memangkas spasi kosong, dan sebagainya. Semua operator juga tersedia di node Ekspresi Kolom.
Filter Baris:Memfilter baris yang masuk atau keluar dari tabel data input menurut aturan pemfilteran. Aturan pemfilteran dapat mencocokkan nilai dalam kolom yang dipilih atau angka dalam rentang numerik.
Ganti Nama Kolom
Penggantian Nama Kolom:Menetapkan nama dan jenis baru ke kolom yang dipilih, seperti yang dikonfigurasi dalam dialog.
Kirim ke Tableau Pelayan
S Konektor ke Tableau:Ekspor tabel data input ke dalam file
atau server Tableau untuk pelaporan.
tinyurl.com/KNIME-Pemula
(Semua visualisasi bersifat interaktif)
Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.com
Tekan KNIME
Perluas pengetahuan Anda tentang KNIME dengan koleksi buku dari KNIME Press. Untuk pengguna pemula dan lanjutan, hingga mereka yang tertarik pada topik khusus seperti deteksi topik, pencampuran data, dan solusi klasik untuk kasus penggunaan umum menggunakan KNIME Analytics Platform - ada sesuatu untuk semua orang. Tersedia untuk diunduh di www.knime.com/knimepress.
PISAU
®PEMULA S
KEBERUNTUNGAN
Keputusan Pembelajar Pohon Pembaca Berkas Pemisahan
Pohon Keputusan Prediktor
pelatihan untuk prediksi pendapatan
Pencetak gol asli
kumpulan data
80 lawan 20
lampirkan kelas kemungkinan
matriks kebingungan + skor
Panduan Platform Analisis KNIME untuk Pemula
Penulis: Satoru Hayasaka dan Rosaria Silipo
KNIME untuk Ilmu Hayati
Kumpulan Kasus Penggunaan
Campurkan & Ubah Validasi & Terapkan
EDISI KEDUA
Pencampuran Data dengan KNIME
Model &
Membayangkan Penciptaan Produksi
Proses Produksibahasa inggris Mengkonsumsi &
Berinteraksi
Optimalkan & Tangkap Pantau & Perbarui
PISAU
®Rosaria Silipo & Lada Rudnitckaia
© 2022 KNIME AG. Semua hak dilindungi undang-undang. KNIME®merek dagang dan logo dan TERBUKA UNTUK INOVASI®merek dagang digunakan oleh KNIME AG di bawah lisensi dari KNIME GmbH, dan terdaftar di Amerika Serikat.®juga terdaftar di Jerman.