8001 Zürich, Swiss
Talak 50
Untuk informasi mengenai izin dan penjualan, tulis ke:
Buku ini telah diperbarui untuk KNIME 4.7.
Tekan KNIME
Semua hak cipta dilindungi undang-undang. Publikasi ini dilindungi oleh hak cipta, dan izin harus diperoleh dari penerbit sebelum melakukan reproduksi, penyimpanan dalam sistem pencarian, atau transmisi dalam bentuk atau cara apa pun, baik secara elektronik, mekanis, fotokopi, rekaman, atau yang serupa.
Hak Cipta © 2023 oleh KNIME Press
Swiss
Dengan demikian, pengguna KNIME pola dasar tidak lagi harus menjadi pakar penambangan data, meskipun tujuannya masih sama: memahami data dan mengekstrak informasi berguna.
Buku ini ditulis untuk orang-orang yang familier dengan Alteryx dan kini tertarik untuk mencari tahu cara beralih ke Platform Analisis KNIME. Anggaplah buku ini seperti kamus bahasa asing: Kami melihat bagaimana tugas-tugas yang paling umum digunakan diucapkan dalam "Alteryx" dan kemudian menerjemahkannya ke dalam "KNIME". Cari tahu, misalnya, cara mengimpor dan memanipulasi data, cara melakukan pemodelan dan pembelajaran mesin, yang mencakup bagian-bagian tentang regresi, pengelompokan, jaringan saraf, dan komponen, dan masih banyak lagi. Lampiran berisi alat cepat yang berguna untuk referensi simpul.
analisis data yang cukup sederhana dan intuitif untuk digunakan. Hal ini, ditambah dengan fakta bahwa KNIME Analytics Platform bersifat open source, telah mendorong banyak profesional untuk menggunakannya. Selain itu, vendor perangkat lunak pihak ketiga mengembangkan ekstensi KNIME untuk mengintegrasikan alat mereka ke dalamnya. Node KNIME kini tersedia yang menjangkau lebih dari sekadar manajemen hubungan pelanggan dan intelijen bisnis, meluas ke bidang keuangan, ilmu hayati, bioteknologi, farmasi, dan industri kimia.
Platform Analisis KNIME adalah alat yang ampuh untuk analisis data dan visualisasi data. Platform ini menyediakan lingkungan yang lengkap untuk
Kata pengantar
FILE LOKAL BASIS DATA
MEMFILTER DATA
PENYORTIRAN
BASIS DATA SUMBER LAINNYA
KONEKSI FILE JARAK JAUH FILE LOKAL
MENGAGREGASI DATA
5
MENULIS DATA 11
1
7
14 MENGIMPOR DATA
9
11
16 5
13 6 Antarmuka Platform Analisis KNIME
MEMANIPULASI DATA
14 15
Daftar isi
20
DOKUMENTASI ALUR KERJA ANDA
27 DATA GEOSPASIAL
26
32 19
MANIPULASI TABEL
26 25
PEMODELAN DAN PEMBELAJARAN MESIN
23
32 DATA SAMPEL
26 DATA NUMERIK
24 21
26
27 DATA YANG HILANG
KONTROL ALUR KERJA PERHITUNGAN MULTI-BARIS
METANODA KOMENTAR NODE
Daftar isi
APLIKASI DATA ( APLIKASI ANALITIK) ANOTASI ALUR KERJA
PEMBELAJAR, PREDIKTOR, DAN PEMBERI SKOR
LAMPIRAN 40 38 36
40 42 44
LINGKARAN
JENIS DATA YANG TERSEDIA VARIABEL ALIRAN
ALAT CEPAT UNTUK REFERENSI NODE LINK BERGUNA
Platform Analisis KNIME Alteriks
Antarmuka Platform Analisis KNIME
Dialog Konfigurasi Repositori Node Penjelajah KNIME
Editor Alur Kerja
Jendela Hasil
Deskripsi Node
Ini setara dengan Alteryx Tool Palette. Di KNIME kami menyebut alat-alat tersebut sebagai “node” dan alat-alat tersebut dapat dicari dari sini dan diseret ke editor alur kerja.
Ini setara dengan Canvas di Alteryx, di sinilah Anda menyeret & melepas node untuk membangun alur kerja Anda.
Untuk mengonfigurasi node di KNIME, klik kanan node yang ingin Anda konfigurasikan dan pilih Konfigurasi. Tidak seperti Alteryx, di KNIME jendela konfigurasi node tidak selalu terbuka.
Di sinilah Anda dapat menelusuri berkas yang disimpan di ruang kerja KNIME; ruang kerja hanyalah direktori atau folder yang terhubung dengan KNIME untuk menyimpan alur kerja KNIME, pengaturan node, dan data yang dihasilkan oleh alur kerja. Misalnya, berkas ini dapat berupa berkas sumber data seperti .csv atau berkas alur kerja KNIME seperti knwf.
Seperti jendela konfigurasi di Alteryx, jendela hasil tidak selalu terbuka di KNIME, jendela tersebut dapat diakses dengan mengklik kanan node dan memilih output yang ingin Anda lihat. Atau, tampilan Node Monitor dapat diaktifkan untuk menampilkan data langsung. Kita akan membahasnya secara terperinci di halaman berikutnya.
Pemantau Node
Antarmuka Platform Analisis KNIME
tetapi ingatlah Node Monitor jika Anda ingin mendalami lebih jauh kegunaannya!
Tampilan lain yang tersedia memungkinkan Anda melihat pengaturan konfigurasi, informasi waktu proses, dan Variabel Aliran yang ada setelah node yang dipilih.
Kami akan membahas variabel aliran nanti di buku ini.
Tampilan opsional ini dapat diaktifkan dengan membuka View > Other > Node Monitor dan memilih open. Anda dapat melihat di Gambar 2 di sebelah kiri.
Selanjutnya, jika Anda mengklik tanda panah di tampilan Node Monitor, Anda akan melihat beberapa opsi berbeda di sini. Jangan ragu untuk mencoba-coba dan melihat apa yang ditampilkan setiap tampilan, tetapi untuk saat ini mari gunakan opsi Show Output Table (lihat Gambar 3). Ini akan memberi Anda tampilan tabel output yang mudah dilihat dari node mana pun yang telah Anda pilih dalam alur kerja Anda, seperti jendela hasil normal di Alteryx.
Jika lampu lalu lintas di bawah node berwarna merah, node tersebut belum dikonfigurasi dan belum siap untuk dieksekusi.
Segitiga kuning mungkin muncul, merinci kesalahan. Dalam kasus ini, node tersebut belum dikonfigurasi.
Node yang dikonfigurasi:
Setelah node dikonfigurasi, lampu lalu lintas akan berubah menjadi kuning, ini berarti node siap dijalankan dan hanya perlu dieksekusi. Beberapa node mungkin terlihat seperti ini saat dimasukkan ke dalam alur kerja jika tidak memerlukan konfigurasi khusus.
sebagai gantinya. Node yang ditunjukkan di bawah ini, node Pembaca File , hanya memiliki port di sebelah kanan, port output. Hal ini karena tidak ada data yang dimasukkan ke dalam node Pembaca File .
Node yang belum dikonfigurasi:
Nama ditulis di atas node. Di bawah node terdapat deskripsi teks yang dapat diedit, yang dapat Anda gunakan untuk mendokumentasikan secara lebih rinci apa yang dilakukan setiap node. Node memiliki port, ini adalah versi KNIME dari jangkar. Mereka disebut port input jika berada di sebelah kiri dan port output jika berada di sebelah kanan. Port input mewakili data yang dimasukkan ke dalam node untuk diproses dan port output mewakili data yang dikeluarkan dari node. Port hadir dalam beberapa jenis, yang paling umum adalah port data, yang diwakili oleh segitiga hitam. Jenis umum lainnya adalah port koneksi basis data yang diwakili oleh kotak cokelat
Di KNIME Analytics Platform, Anda membangun alur kerja dengan menyeret node dari Node Repository ke Workflow Editor, lalu menghubungkan, mengonfigurasi, dan menjalankannya. Seperti alat di Alteryx, ada banyak node untuk berbagai tugas. Node
Node yang dieksekusi:
Setelah node dieksekusi, lampunya berubah menjadi hijau. Pada titik ini, data tersedia di port output untuk dilihat atau diproses lebih lanjut di port output.
Antarmuka Node
Lampu Lalu Lintas Mengidentifikasi Status Node
Node Pembaca File dapat membaca hampir semua data ANSCII. Node ini secara otomatis mendeteksi format umum.
Node Pembaca Berkas:
Node Pembaca File juga dapat menangani file Excel, tetapi node Pembaca Excel memungkinkan Anda membaca lembar, baris, atau kolom tertentu.
Node Pembaca CSV:
Mari kita lihat masing-masing node KNIME satu per satu, lihat apa yang membuat masing-masing node istimewa. Saya akan memberi Anda petunjuk, yaitu jenis file yang dapat dibaca dan bagaimana konfigurasinya.
Node Pembaca Excel:
File lokal, seperti file Excel, CSV, PDF, JSON, file teks, dan banyak lainnya, adalah file-file umum yang hanya ada di hard drive Anda. Mirip dengan Alteryx, Anda cukup menyeret dan meletakkan file yang ingin Anda impor ke Editor Alur Kerja; KNIME secara otomatis memasukkan node yang tepat yang diperlukan untuk membacanya.
Di Alteryx, semua impor data Anda dilakukan melalui berbagai konfigurasi alat Input Data . Di KNIME Analytics Platform, sejumlah node yang berbeda mengisi semua peran yang sama. Di sini, kita akan melihat file lokal, basis data, dan sumber lainnya, untuk membahas beberapa opsi yang paling umum.
Node Parser Tika:
Node ini menggunakan pustaka Apache Tika dan dapat membaca banyak tipe data! Cobalah dengan email atau PDF.
Meskipun berkas CSV dapat dibaca oleh simpul Pembaca Berkas , simpul Pembaca CSV memberi Anda pilihan yang lebih spesifik.
Mengimpor Data
File Lokal
Banyak dari simpul pembaca berkas ini bahkan dapat digunakan untuk terhubung ke repositori jarak jauh seperti Amazon S3 Buckets, Azure Blogs, Google Drives , dan banyak lagi! Pada simpul pembaca yang kompatibel, Anda akan melihat serangkaian tiga titik di sudut kiri bawah simpul. Secara umum, beginilah cara kami mengaktifkan port opsional di KNIME. Klik ikon ini dan aktifkan port opsional. Sekarang kita dapat menghubungkan simpul pembaca ke repositori berkas jarak jauh mana pun yang kita inginkan!
tabel.
Pada gambar di sebelah kiri, beberapa koneksi jarak jauh ini ditampilkan. Koneksi jarak jauh ini memerlukan dua node untuk dihubungkan sebelum node pembaca yang sebenarnya. Satu untuk autentikasi, tempat Anda masuk ke sistem, dan yang kedua untuk membuat koneksi. Ini biasanya sistem yang memiliki beberapa integrasi layanan.
Sistem jarak jauh lain yang "lebih sederhana" mungkin hanya memerlukan satu simpul konektor (lihat gambar di sebelah kanan) tempat autentikasi diintegrasikan ke dalam simpul konektor. Misalnya, mengambil file CSV dari situs FTP hanya memerlukan dua simpul seperti yang Anda lihat pada contoh di sebelah kanan.
Node ini, seperti namanya, adalah untuk membaca file JSON. KNIME juga dapat mengubahnya menjadi
Node ini untuk membaca file XML. Secara opsional, Kueri XPath dapat ditentukan di jendela konfigurasi.
Node Pembaca XML:
Node Pembaca JSON:
Koneksi File Jarak Jauh
Basis Data
Mengimpor Data
Di Alteryx ini seperti menggunakan alat Connect In-DB dan alat Data Stream Out .
Jadi bagaimana kita terhubung ke basis data di KNIME? Ini dilakukan dengan simpul Konektor Basis Data , baik itu format tradisional seperti MySQL, atau yang berbasis Hadoop seperti Impala atau Hive. Setelah koneksi itu terbentuk, kita dapat memilih tabel di simpul Pemilih Tabel DB . Simpul Konektor DB di paling kiri alur kerja yang ditunjukkan di atas adalah konektor generik, yang merujuk ke JDBC
Sekarang mari kita bahas tentang koneksi ke basis data; hal pertama yang ingin saya sampaikan adalah Anda tidak dapat melihat port data apa pun di sebagian besar node KNIME di bawah ini. Sebagai pengingat, port data adalah segitiga hitam di setiap sisi node yang menunjukkan data tabel KNIME yang mengalir masuk dan keluar dari node.
driver dan terhubung ke apa pun yang mendukungnya.
Berikutnya, Anda dapat melihat folder Query , yang dibuka di Node Repository (lihat
gambar di sebelah kanan), jadi mari kita bahas itu juga selagi kita di sini. Alat Alteryx
di atas biasanya digunakan dengan beberapa alat In-Database lainnya , seperti
sorting, filtering, merged, yaitu, pemrosesan standar terutama. Keuntungan
menjalankan proses di database adalah kecepatan dan fakta bahwa proses ini
membatasi data yang akan ditransfer. KNIME mendukung fungsionalitas ini. Pada
gambar di sebelah kanan, Anda dapat melihat beberapa manipulasi yang tersedia
untuk pemrosesan in-database dengan KNIME Analytics Platform. Semua node di
folder Query dapat dimasukkan ke dalam alur kerja antara DB Table Selector
node dan node DB Reader . KNIME menggunakan node ini untuk membuat kode
SQL secara otomatis untuk Anda. Ini berguna jika Anda bukan ahli SQL atau ingin
kembali dan mengubah kueri Anda dengan mudah.
Sumber Lainnya
Mengimpor Data
Dua lingkungan koneksi di bagian ini adalah node Twitter dan node Google . Semua ini dapat ditemukan di bagian Media Sosial dari Repositori Node. Node Konektor API Twitter mengharuskan Anda menyediakan Kunci API di jendela konfigurasi. Node Autentikasi Google bahkan lebih mudah dikonfigurasi; dalam dialog konfigurasi node, klik tombol Autentikasi
Catatan. Deskripsi node di KNIME Workbench atau di KNIME Community Hub memberi tahu Anda semua yang perlu Anda ketahui tentang cara mengonfigurasi node. Misalnya, node Get Request dan Download (lama) sangat bagus.
tombol. Ini akan membuka layar login akun Google yang sudah dikenal di peramban web Anda, tempat Anda dapat menyetujui akses ke file Anda untuk KNIME ke file Anda – dan selesai!
Selain file dan basis data lokal, masih banyak sumber data lain yang dapat diakses! Kita akan membahas beberapa di antaranya di bagian ini.
sumber daya!
Untuk singkatnya, kita akan melihat dua dari simpul-simpul ini saja. Silakan menjelajahi simpul-simpul lainnya sendiri.
Node Pembaca Google Sheets:
Di jendela konfigurasi node ini, yang harus Anda lakukan adalah menentukan spreadsheet mana yang ingin Anda ambil datanya dan lembar mana di dalamnya.
Daftar file yang dapat Anda akses akan muncul saat Anda mengklik tombol pilih (lihat gambar di sebelah kanan).
Setelah Anda terhubung ke Twitter API dengan konfigurasi konektor, pencarian Anda menjadi mudah. Di bagian atas, ketikkan kueri Anda seperti yang Anda lakukan di twitter.com/search. Di bagian bawah, pilih bidang yang ingin Anda dapatkan hasilnya (lihat gambar di sebelah kiri).
Node Pencarian Twitter:
Node Penulis Excel:
Node yang tercantum di sini adalah untuk menulis file lokal, baik format penyimpanan data standar seperti CSV, Excel, dan JSON, yang, di Alteryx, akan Anda tulis dengan alat Output Data , dan gambar serta PDF, yang akan Anda tulis dengan alat Image dan Render di Alteryx. Sekali lagi, perbedaan utama di sini adalah bahwa di Alteryx alat output Anda dapat dikonfigurasi secara berbeda untuk melakukan tugas yang berbeda dan di KNIME kami memiliki node terpisah untuk tugas-tugas terpisah ini.
Node ini menulis ke berkas CSV, yang memungkinkan adanya pembatas, pola nilai yang hilang, konfigurasi kutipan, dan banyak lagi.
Node ini memungkinkan Anda untuk mengekspor dengan cepat ke file XLS. Untuk opsi lanjutan, kita akan melihat lebih banyak node di halaman berikutnya.
pada koneksi jarak jauh.
Node Penulis CSV:
Catatan. Koneksi jarak jauh juga berfungsi saat menulis data! Cukup klik ikon 3 titik dan pilih “Add File System Connection port”. Kemudian Anda bebas terhubung ke koneksi jarak jauh mana pun yang Anda perlukan! Lihat halaman 6 untuk informasi lebih lanjut
Sejauh ini, kita telah melihat antarmuka – KNIME Workbench; dan cara memasukkan data ke KNIME. Sekarang, mari kita lihat cara mendapatkan data dari KNIME. Di bawah ini, pertama-tama Anda akan menemukan daftar node untuk menulis file lokal dan, kedua, bagian yang membahas cara memasukkan data Anda ke dalam basis data. Setelah selesai di sini, kita akan menyelami beberapa alat untuk menangani data di KNIME!
Menulis Data
File Lokal
Hubungkan ke simpul ini jika Anda ingin mengekspornya.
Beberapa simpul grafik mengeluarkan gambar.
Node Penulis XML: Tabel ke simpul PDF:
Tulis nilai ke file JSON dengan simpul ini.
Secara opsional, Anda dapat menentukan untuk mengompresi output secara otomatis.
Node Penulis Gambar (Port):
Node Penulis JSON:
Sel tabel dapat menampung tipe data XML. Node ini menuliskan sel-sel tersebut sebagai file terpisah.
Node ini membuat versi PDF dari tabel data Anda.
Gabungkan dengan grafik untuk menyertakan cuplikan data aktual.
Di bawah ini, Anda melihat serangkaian node XLS Formatter. Node-node ini saling terhubung dan setiap node mengubah bit format dalam file Excel yang akan Anda tulis.
Sifat modularnya memudahkan Anda untuk menyesuaikan format sesuai keinginan dan memungkinkan Anda untuk menambahkan atau menghapus bagian-bagian. Ada berbagai node untuk tujuan ini; jika ini merupakan kasus penggunaan utama bagi Anda, lihat panduan tertaut di bawah ini untuk pengenalan lengkap tentang format file Excel di KNIME:
https://www.knime.com/community/continental-nodes-for-knime-xls-formatter
Basis Data
Menulis Data
• Node Konektor DB: Ini menyediakan informasi untuk menghubungkan ke basis data, misalnya, kredensial login.
• Node Pembaca File/ Node Pembuat Tabel: Data yang ingin Anda tambahkan ke database Anda, ini juga dapat diproses oleh Anda
• Node Penulis DB: Di sinilah Anda menentukan nama tabel yang ingin Anda tulis serta kolom mana yang ingin Anda tulis.
Catatan. Node yang sama persis ini juga dapat digunakan untuk memberi makan node Pemilih Tabel DB saat membaca dari database, dan, dengan menukar info database di konektor, Anda dapat dengan mudah mentransfer dari lingkungan pengembangan ke lingkungan produksi.
alur kerja sebelum menulis.
Saat membaca dari basis data di KNIME, info koneksi disimpan dalam node terpisah – node Konektor DB . Node ini menyediakan satu dari dua input yang dibutuhkan oleh node Penulis DB , yang lainnya adalah port data yang berisi tabel yang ingin Anda tulis ke basis data Anda.
Menulis ke database mudah dilakukan dengan KNIME dan hanya ada satu perbedaan utama antara KNIME Analytics Platform dan Alteryx:
untuk menulis padanya.
Penyaringan Data
Memanipulasi Data
Node Ganti Nama Kolom KNIME mengisi kegunaan lainnya!
mengembalikan semua skor lebih dari 90%, dan juga, semua Jon Node Filter Baris:
keluarga Smith.
Penyaringan baris di KNIME dilakukan dengan beberapa node berbeda: node Filter Baris ,
$Score$ > 0.9 => BENAR Node Filter Baris Berbasis Aturan , dan node Pemisah Baris , yang digunakan untuk mengumpulkan baris
yang tidak cocok. Untuk pemfilteran kolom, node Filter Kolom adalah tempat pemberhentian utama Anda!
Di Alteryx, alat Pilih memiliki beberapa tujuan, salah satunya adalah memfilter kolom.
$Nama$ = “Jon Smith” => BENAR
Node Filter Baris Berbasis Aturan mirip dengan kemampuan pembuat ekspresi di Pilih
di atas kecuali mengekspor baris yang disertakan dan dikecualikan. Anda akan melihat bahwa ada dua
node dalam SPSS Modeler. Anda memasukkan serangkaian aturan, yang dijalankan satu per satu. Aturan pertama yang cocok dengan baris mengakhiri proses, misalnya:
port data keluaran (diwakili oleh segitiga hitam di sebelah sertakan atau kecualikan filter.
…
Node Filter Baris Berbasis Aturan:
Node Pemisah Baris:
Memungkinkan penyaringan cepat dengan cara pencocokan pola string, rentang numerik, atau nilai yang hilang.
Pemfilteran ini dapat dilakukan pada kolom atau ID baris itu sendiri dan dapat ditetapkan sebagai
Node ini bekerja seperti node Filter Baris
MANIPULATING
Penyortiran
Memanipulasi Data
Anda juga dapat mengurutkan kolom di KNIME Analytics Platform menggunakan node Column Resorter . Anda dapat mengurutkan berdasarkan abjad, atau secara manual. Ini mungkin berguna saat menggabungkan tabel secara vertikal dengan nama kolom yang berbeda atau saat menggabungkan beberapa kolom menjadi tipe data daftar dengan node Column Aggregator .
Node Resor Kolom:
Menyortir data merupakan transisi yang mudah karena kedua aplikasi memiliki satu alat/simpul untuk ini, dan keduanya bahkan diberi nama yang sama, Sort dan Sorter! Simpul Sorter KNIME dikonfigurasikan seperti alat Alteryx: cukup tetapkan daftar kolom untuk disortir dan catat apakah kolom tersebut harus menaik atau menurun. Di KNIME, Anda juga memiliki opsi untuk memindahkan semua sel yang hilang ke bagian akhir jika diinginkan dengan mencentang kotak di tab Advanced Settings pada dialog konfigurasi.
Mengumpulkan Data
tab dialog konfigurasi (kiri), pilih kolom mana yang akan menentukan pengelompokan. Saya
menggunakan kolom String Cluster di sini. Setelah dipilih, kolom pengelompokan akan muncul di kotak hijau di sebelah kanan.
Terakhir, tentukan jenis agregasi yang akan digunakan. Ada banyak pilihan, mulai dari penggabungan hingga rata-rata hingga kemiringan dan banyak lagi
Dalam kasus ini, jendela konfigurasi terlihat sedikit berbeda di KNIME. Pertama, di Grup
Agregasi data dasar adalah percakapan satu-satu antara KNIME Analytics Platform dan Alteryx:
Alat Summarize ke node GroupBy .
lagi.
Berikutnya, pada tab Agregasi Manual (kanan), pilih kolom mana yang tersisa untuk digabungkan dan disertakan dalam output.
Gunakan simpul ini untuk hal-hal seperti menghapus spasi, menghapus tanda baca, ekspresi regex, pembuatan sub-string, penggunaan huruf kapital, dan banyak lagi.
Gunakan node String Replacer untuk penggantian cepat atau bahkan penghapusan di dalam string.
Misalnya, konfigurasikan node ini untuk mengganti semua contoh “dua” dengan “2”.
Node ini akan mengambil satu kolom string dan membaginya menjadi beberapa kolom
berdasarkan pembatas yang ditentukan, misalnya,
Node ini juga mendukung ekspresi reguler.
Node Manipulasi String:
node tetapi memungkinkan kontrol lebih dengan mengambil daftar aturan dan kecocokan yang ditentukan pengguna
Node Pemisah Sel:
ke setiap baris input. Misalnya, Anda dapat memformat ulang string secara berbeda, tergantung pada sumbernya.
Node Mesin Aturan:
Node Pengganti String:
Di bagian ini, kami akan membahas beberapa opsi untuk memanipulasi data string, yaitu padanan KNIME untuk alat Formula, Text to Columns, dan Find Replace di Alteryx. Alat Formula paling mirip dengan simpul String
Manipulation , yaitu untuk menulis instruksi perubahan string dasar. Simpul Rule Engine juga mirip tetapi dapat digunakan dengan cara yang lebih rumit karena memungkinkan fungsionalitas tipe 'if then'. Alat Text to Columns dapat digantikan oleh simpul Cell Splitter .
Node Rule Engine memiliki beberapa fungsi yang sama dengan String Manipulation
koma. Fitur ini tidak tersedia di Pemodel SPSS.
Data Rangkaian
STRING
Anda dapat mengarahkan node ini ke berkas teks (kamus) yang diformat sebagaimana dijelaskan secara rinci di jendela Deskripsi node . Ada sedikit pengaturan di sini, tetapi dengan ini Anda dapat dengan mudah mengganti sekumpulan besar string.
Jika tidak, node ini berfungsi sebagai node Pengganti String . Node Pengganti String (Kamus):
Node ini memungkinkan tempat penyimpanan numerik yang ditentukan sendiri. Cobalah node Auto-Binner untuk opsi otomatis seperti tempat penyimpanan berukuran sama atau interval yang sama.
setara, tetapi simpul Kolom Lag akan memungkinkan Anda untuk memindahkan nilai ke baris berikutnya.
Dengan sedikit kerja, simpul ini dapat digabungkan dengan simpul Rumus Matematika untuk membuat Node Agregasi Bergerak akan menggantikan node total yang sedang berjalan. Node ini dapat dikonfigurasikan dengan berbagai cara, lihat saja!
Node ini berfungsi sama seperti node Rumus Matematika kecuali ia mengubah beberapa kolom sekaligus!
Node Binner Numerik:
KNIME tidak memiliki formula multi-baris Memindahkan simpul Agregasi:
Node Rumus Matematika (Multi Kolom):
Node Normalizer akan meregangkan atau
memampatkan data Anda agar berada dalam rentang tertentu, umumnya 0 hingga 1.
Seperti node Filler/ Derive dalam SPSS Modeler, node Math Formula akan memungkinkan Anda mengubah data numerik dengan fungsi matematika umum.
Ada banyak sekali cara untuk memanipulasi angka saat menyiapkan, menganalisis, dan memodelkan data. Kami akan membahas beberapa contoh umum dan membahas cara memulai manipulasi ini di KNIME.
Node Kolom Lag:
Node normalisasi:
efek serupa.
Node Rumus Matematika:
Data Numerik
NUMERIC
(lihat gambar di sebelah kanan).
Jika Anda perlu membuat jeda pada beberapa kolom asli, cukup terapkan simpul Kolom Jeda kedua ke alur kerja Anda. Setelah Anda membuat
Untuk menggunakan simpul Kolom Lag , pertama-tama Anda pilih kolom yang akan diberi lag di menu drop-down (lihat gambar di sebelah kiri). Selanjutnya, Anda pilih Lag dan Interval Lag, ini berarti Anda tentukan jumlah kolom yang diberi lag untuk dibuat (Lag) dan jumlah baris yang akan diberi lag setiap kali (Interval Lag). Saya pilih Lag = 3 dan Interval Lag = 1, jadi saya telah membuat tiga kolom, masing-masing diberi lag dari kolom terakhir.
Alteryx memiliki alat yang disebut Formula Multi-Baris. Hal ini dilakukan di Platform KNIME Analytics melalui kombinasi simpul Kolom Lag dan simpul Formula Matematika . Yang pertama membuat kolom baru dengan nilai yang digeser. Misalnya, jika Anda ingin merujuk baris sebelumnya dalam formula Anda, Anda dapat menggunakan simpul Kolom Lag dengan nilai 1 sebelum menerapkan simpul Formula Matematika . Ini membuat kolom baru untuk Anda referensikan.
nilai tertinggal yang Anda butuhkan untuk perhitungan Anda, Anda dapat memanggilnya seperti Anda memanggil nilai lain di simpul rumus pilihan Anda.
Perhitungan Multi-Baris
Konfigurasi Kolom Lag Noe
Data Geospasial
Lat/Lon ke simpul Geometri:
Node pertama yang Anda gunakan dalam analisis spasial mungkin adalah node GeoFile Reader . Anda dapat menggunakannya untuk mengakses .shp, .gpkg, atau .geojson Node Pembaca GeoFile:
Salah satu tambahan terbaru pada platform KNIME Analytics adalah ekstensi Geospatial Analytics, yang dikembangkan bekerja sama dengan Center for Geographic Analysis di Harvard University. Kumpulan node yang terus berkembang ini menyediakan berbagai macam manipulasi, kalkulasi, dan visualisasi untuk data geospasial. Dengan ekstensi ini, file geo dapat dibaca, dibuat dari koordinat Lat/Lon numerik, atau bahkan dari representasi WKT. Di luar kalkulasi jarak dan area standar, bentuk dapat dipotong, dibatasi, dan bahkan dimodelkan dengan model Geographically Weighted Regression (GWR). Lihat KNIME Community Hub untuk daftar lengkap node dan fitur!
Jika data spasial Anda disimpan sebagai pasangan Lintang dan Bujur dan bukan sebagai file geo, Anda dapat mengonversinya ke tipe data spasial menggunakan simpul Lat/ Lon ke Geometri . file. Ada juga node GeoFile Writer yang setara .
Node Jarak Haversine:
setiap rekaman dari tabel paling atas diberi rekaman terdekat dari tabel paling bawah, atau sebaliknya.
Buat simpul Grid:
Gunakan simpul Buat Kisi untuk membagi wilayah poligon menjadi beberapa sektor. Tentukan ukuran kotak kisi dengan mengatur panjangnya dalam meter saat mengonfigurasi simpul.
Jika data spasial Anda disimpan dalam string WKT dan bukan file geo, Anda dapat menggunakan node WKT ke Geometri untuk mengubahnya ke tipe data spasial.
Node Nearest Join mengambil dua tabel sebagai input. Bergantung pada pengaturan penggabungan, Node Gabung Terdekat:
Node WKT ke Geometri:
Simpul penyangga:
Node Buffer membuat kolom geometri berisi poligon yang mewakili ruang dalam jarak tertentu dari suatu titik atau objek spasial lainnya.
adalah salah satunya. Atau, Anda dapat menggunakan simpul Euclidean Distance . Alteryx menggunakan satu alat untuk perhitungan jarak, namun, di KNIME Analytics Platform terdapat beberapa node yang mewakili berbagai jenis jarak.
Node Haversine Distance
Untuk koreksi dasar data yang hilang seperti yang ditangani oleh alat Pembersihan Data di Alteryx, gunakan simpul Nilai Hilang di Platform Analisis KNIME. Simpul ini memiliki opsi seperti menghapus baris dengan data yang hilang, menggunakan nilai sebelumnya, nilai maksimum, rata-rata, rata- rata bergerak, dan banyak lagi. Untuk koreksi yang lebih rumit untuk data yang hilang, seperti mengubah nilai secara berbeda berdasarkan bidang lain, cobalah simpul Mesin Aturan . Simpul ini sering muncul dalam pengantar kami tentang KNIME, tetapi simpul ini benar-benar memiliki berbagai macam kegunaan saat Anda ingin membuat keputusan berdasarkan banyak bidang.
Data Hilang
MISSING
Node Partisi memungkinkan Anda untuk membagi data menjadi dua set berdasarkan persentase atau jumlah rekaman. Ada beberapa opsi untuk cara pembagian partisi ini: dari atas, pengambilan sampel linier, pengambilan sampel acak, dan pengambilan sampel bertingkat.
Deskripsi node mendefinisikan istilah-istilah ini dengan baik, jadi jangan lupa untuk mencarinya di KNIME Community Hub, jika Anda tidak yakin.
pemodelan ada banyak pilihan yang tersedia di Platform Analisis KNIME.
Apakah Anda ingin mengambil sampel data untuk mengurangi waktu eksekusi untuk analitik atau membangun set pelatihan untuk pembelajaran mesin dan
Node Bootstrap Sampling memungkinkan penggunaan teknik bootstrapping untuk mengambil sampel berlebih dari data Anda secara artifisial, sehingga menghasilkan kumpulan data yang lebih besar. Node Equal Size Sampling mengharuskan Anda memilih kolom nominal untuk menentukan kelas yang berbeda; kemudian node ini membuat kumpulan sampel dengan jumlah rekaman yang sama untuk setiap kelas. Ini dapat membantu saat melatih model berdasarkan algoritme penghitungan seperti pohon keputusan. Terakhir – ingatlah bahwa ada node Database Sampling . Melakukan pengambilan sampel
Data Sampel
SAMPLING
Node berputar:
Node yang tidak berputar:
Gunakan simpul Concatenate untuk menggabungkan tabel secara vertikal. Simpul ini akan mencocokkan kolom berdasarkan nama dan dapat dikonfigurasi untuk
mempertahankan gabungan atau perpotongan kolom di dua tabel input.
Menyiapkan node Unpivoting juga mudah.
Pivoting memungkinkan Anda membuat kolom tambahan di tabel dengan cara memutar beberapa baris ke atas secara efektif. Unpivoting adalah kebalikan dari proses ini dan memungkinkan Anda mengurangi jumlah kolom di tabel dengan membuat lebih banyak baris untuk menyimpan data.
Cukup pilih bidang yang ingin Anda cocokkan dan jenis gabungan: dalam, kiri-luar, kanan-luar, penuh
Gabungkan simpul:
ingin mempertahankan.
3) Metode agregasi untuk bidang Anda Node penyambung:
Sekarang saya ingin membahas beberapa operasi dasar untuk memanipulasi tabel, bukan hanya memanipulasi data di dalamnya. Node Joiner menggabungkan tabel secara horizontal, sedangkan node Concatenate menggabungkannya secara vertikal.
Node Joiner di KNIME akan menggantikan node Merge di SPSS Modeler. Tidak banyak yang perlu dibiasakan di sini.
Mengonfigurasi node ini mudah jika Anda terbiasa dengan tabel pivot. Anda cukup menentukan tiga hal: 1) Kolom yang digunakan sebagai pivot. Isinya akan menjadi kolom baru.
2) Kolom yang akan digunakan sebagai grup.
Pilih saja kolom yang ingin Anda putar kembali ke dalam baris berbeda (= kolom nilai) dan kolom dengan nilai yang ingin Anda pertahankan (= kolom yang dipertahankan).
Ini akan memungkinkan Anda menggabungkan baris-baris saat Anda melakukan pivot.
luar.
Manipulasi Tabel
MANIPULATIONS
Dengan mengklik dua kali teks di bawah node, Anda dapat mengedit komentar. Gunakan ini untuk mencatat perubahan atau sekadar memberikan detail lebih lanjut tentang apa yang dilakukan node dalam alur kerja Anda. Anda dapat mengomentari node, metanode, dan komponen.
Anotasi alur kerja adalah kotak berwarna yang dapat Anda tempatkan di atas alur kerja Anda, seperti yang dapat dilihat dalam banyak contoh KNIME. Penggunaan yang umum adalah untuk memisahkan bagian-bagian alur kerja Anda secara jelas ke dalam pemuatan data, ETL, pemodelan, dan prediksi. Hal ini memudahkan rekan kerja untuk mengidentifikasi area yang mereka cari dengan cepat. Anda dapat menyesuaikan warna batas, latar belakang, dan fon/ukuran teks.
KNIME menawarkan beberapa opsi untuk menjaga alur kerja Anda tetap teratur. Menggunakan semuanya secara
bersamaan akan menjaga alur kerja Anda tetap rapi, rapi, dan mudah dibaca oleh rekan kerja Anda. Pada gambar di sebelah kanan terdapat node dengan komentar, anotasi, dan metanode bernama dengan komentar.
Metanode seperti subfolder di dalam alur kerja. Metanode adalah wadah di sekitar pilihan node. Untuk membuat metanode, cukup sorot semua node yang ingin
Mendokumentasikan Alur Kerja Anda
Anotasi Alur Kerja Komentar Node
Metanoda
Pembelajar, Prediktor, dan Penilai
Nah, tentu saja, untuk menghasilkan model yang berhasil untuk penerapan, Anda perlu memastikan bahwa Anda telah membersihkan data dan menyelesaikan rekayasa fitur apa pun yang mungkin ingin Anda lakukan terlebih dahulu, tetapi beginilah tampilan pelatihan model di KNIME. Cukup mudah, bukan?
Model berbasis pohon sangat serbaguna dan tersedia dalam berbagai jenis. Beberapa menyaingi kekuatan prediktif jaringan saraf dalam, tetapi membutuhkan sebagian kecil data dan waktu pelatihan. Model-model ini tidak boleh diabaikan dan KNIME mendukung pelatihan dan penerapan banyak model.
Di KNIME Analytics Platform, pembuatan model sebagian besar dilakukan dalam kerangka kerja yang sama, apa pun jenis model yang ingin Anda buat.
Anda akan memulai dengan beberapa data, membaginya menjadi beberapa subset pelatihan dan pengujian, menerapkan node Learner , node Predictor, dan terakhir node Scorer untuk melihat beberapa statistik.
Meskipun Alteryx tidak diragukan lagi memudahkan pekerjaan para insinyur data dan ilmuwan data, alat prediktifnya tidak seluas atau dapat disesuaikan seperti fungsionalitas yang ditawarkan di KNIME Analytics Platform. Di kedua lingkungan tersebut, Anda dapat terhubung ke alat eksternal untuk melatih model Anda, misalnya, ada banyak pustaka R dan Python yang dapat Anda hubungkan, namun, di sini kami ingin melihat apa yang dapat dilakukan secara native.
Pemodelan dan Pembelajaran Mesin
Pohon
MODELING and MACHINE LEARNING
Regresi bukanlah hal baru sama sekali, tetapi masih merupakan alat yang luar biasa untuk memodelkan data numerik, atau bahkan untuk masalah klasifikasi dengan penerapan regresi logistik. KNIME mendukung banyak jenis, dari linier hingga polinomial hingga logistik dan bahkan pohon dan hutan. Semua ini dapat diimplementasikan langsung di Platform Analisis KNIME, tetapi beberapa dapat digunakan di Spark untuk memanfaatkan komputasi paralel. Seperti halnya algoritma berbasis pohon di bagian sebelumnya, Anda juga memiliki akses ke H20 dan XGBoost
node KNIME asli.
Kustomisasi pada model ini juga cukup tangguh dengan kemampuan untuk menyesuaikan ukuran simpul pohon minimal, kedalaman pohon maksimal, dan banyak lagi. Dua metode pembelajaran utama yang didukung adalah Information Gain dan Gini Index.
Baik pohon regresi maupun klasifikasi didukung, begitu pula dengan ensembelnya seperti hutan acak atau hutan yang ditingkatkan. Di KNIME Analytics Platform, Anda dapat menggunakan implementasi khusus KNIME dari algoritme ini serta implementasi dari beberapa alat sumber terbuka populer lainnya, seperti H20, XGBoost, dan Spark.
implementasi untuk algoritma selain
Regresi
Kekelompokan
Pemodelan dan Pembelajaran Mesin
Catatan. Ada simpul terpisah untuk jarak string dan numerik: pilih yang sesuai dengan data Anda.
Mari kita lihat cara menyiapkan pengelompokan hierarkis. Tidak seperti teknik lain yang menggunakan pembelajar dan prediktor, kita memerlukan tiga langkah di sini. Pertama, kita perlu menghitung jarak menggunakan simpul jarak.
Pengelompokan adalah contoh teknik tanpa pengawasan. Ini berarti Anda dapat menggunakannya tanpa data yang diberi label atau
diklasifikasikan sebelumnya, seperti yang biasanya Anda perlukan untuk melatih pohon keputusan, regresi, atau jaringan saraf. Pengelompokan berarti titik data Anda dikelompokkan menurut beberapa metrik jarak. Ada banyak yang tersedia di KNIME – dari jarak Cartesian sederhana, sesuatu yang dapat Anda gunakan untuk mengelompokkan lokasi GPS pada peta, hingga jarak Levenshtein untuk mengukur jumlah karakter yang perlu Anda ubah agar dua string cocok. Yang terakhir terkadang berguna dalam koreksi kesalahan ketik otomatis.
Kedua, kita akan menggunakan jarak tersebut di node Hierarchical Clustering (DistMatrix) untuk membuat pohon cluster. Lalu akhirnya, node
Hierarchical Cluster Assigner menetapkan nilai cluster yang sebenarnya ke setiap baris berdasarkan jumlah cluster atau jarak maksimum, yangdapat Anda atur dalam dialog konfigurasi, seperti yang ditunjukkan pada gambar di bawah ini.
Evaluasi
Jaringan Syaraf
ingin memahami seberapa baik kinerja model Anda dalam berbagai skenario dan di mana model tersebut gagal memilih model terbaik untuk penerapan. Terkadang ini berarti meninjau matriks kebingungan
dengan simpul Scorer untuk statistik seperti akurasi, presisi, dan recall. Atau, evaluasi visual mungkin menjadi yang terbaik, seperti Kurva ROC atau Diagram Lift, saat Anda perlu menyajikan temuan Anda. Sejak versi 4.0, KNIME Analytics Platform Mengevaluasi keberhasilan model Anda adalah tahap penting lainnya dari proses ilmu data. Anda
Jaringan neural di KNIME telah mengalami banyak peningkatan. Di sisi teknis, ekstensi pembelajaran mendalam untuk KNIME memerlukan pengaturan Integrasi Python; yang paling menonjol adalah implementasi Keras dengan backend TensorFlow . Setelah Anda melakukan pengaturan, Anda tidak perlu terlalu khawatir tentang semua itu. Implementasi Keras bekerja dengan menggunakan satu node per lapisan jaringan (ada juga node untuk mengulang dan mengubah lapisan yang ingin Anda sertakan beberapa kali). Keuntungannya ada dua, Anda dapat menyesuaikan setiap lapisan jaringan dengan memilih jenis lapisan, jumlah node, dan lainnya – tergantung pada lapisannya, dan ini memberi Anda visualisasi yang bagus dari jaringan yang telah Anda susun. Selain opsi penyesuaian yang canggih untuk membangun jaringan Anda, KNIME juga dapat memuat model yang telah dilatih sebelumnya, menambahkan lapisan baru ke model tersebut, dan membekukan lapisan untuk mencegahnya dilatih di pelatih jaringan. Bersama-sama, node-node ini membuat penerapan teknik pembelajaran transfer di KNIME menjadi sangat mudah.
Optimasi
Pemodelan dan Pembelajaran Mesin
Terkadang membangun model semudah memuat dataset, memilih teknik pembelajaran, dan mengklik mulai. Namun, sering kali tidak semudah itu! Mungkin hutan acak Anda bekerja dengan sangat baik dengan kedalaman maksimum lima, tetapi tidak bagus sama sekali dengan tujuh.
Mungkin jaringan saraf Anda berhasil dengan lima lapisan tersembunyi, tetapi tidak dengan lima belas. Ada banyak pekerjaan yang harus
dilakukan untuk menyempurnakan model Anda dan memeras setiap ons daya prediksi yang Anda bisa. KNIME dapat membantu dengan ini
melalui fungsionalitasnya yang berbeda untuk penyetelan fitur dan hiperparameter. KNIME mendukung teknik pemilihan fitur dari filter korelasi
untuk menghapus variabel yang sangat berkorelasi, hingga filter varians rendah untuk menghapus variabel yang hampir konstan, hingga
pemilihan fitur maju dan mundur. Ada juga loop untuk penyetelan hiperparameter, yang menjadi fitur model Anda, seperti jumlah lapisan
tersembunyi dalam jaringan saraf, kedalaman maksimum node di pohon, atau angka.
Membangun aplikasi data itu mudah, dan saya akan merangkum langkah-langkahnya di bawah ini, tetapi pertama-tama mari kita bahas KNIME memiliki fungsi yang sangat mirip melalui KNIME Business Hub, yang kami sebut aplikasi data. Anda dapat membangun aplikasi data tersebut dengan menggunakan alur kerja dan membuatnya dapat diakses oleh pengguna bisnis dengan menerapkannya ke KNIME Business Hub.
untuk membiasakan Anda dengan kemampuan fitur-fitur ini alih-alih memberikan panduan lengkap tentang penggunaannya. Lihat KNIME TV di YouTube atau konten apa pun di bagian e-learning situs web KNIME untuk informasi lebih lanjut tentang cara menggunakan fitur ini.
Pengguna bisnis kemudian dapat berinteraksi dengan aplikasi data dari peramban web.
Dalam kata-kata Alteryx: “Aplikasi analitik adalah alur kerja dengan antarmuka pengguna. Buat aplikasi analitik untuk memungkinkan pengguna aplikasi menjalankan alur kerja menggunakan data dan parameter mereka sendiri tanpa harus membangun alur kerja.”
Di bagian ini, kita akan memecah pola kita dan berhenti melihat fungsionalitas yang berhubungan langsung dan alat Alteryx mana yang identik dengan node mana di KNIME. Pertama, kita akan melihat beberapa opsi untuk kontrol alur kerja di Alteryx dan alternatif di KNIME untuk meyakinkan Anda bahwa fungsionalitasnya tersedia, lalu kita akan menyelami aplikasi data, loop, dan variabel aliran. Tujuannya di sini adalah
Kontrol Alur Kerja
Aplikasi Data (Aplikasi Analisis)
Makro di Alteryx adalah cara Anda untuk membuat alat khusus. Anda akan membuat bagian alur kerja menggunakan alat khusus, yang memungkinkan interaksi, lalu menggabungkannya menjadi makro yang dapat digunakan dalam alur kerja lain. Biasanya, Anda ingin melakukan ini untuk tugas umum yang hanya berubah sedikit setiap kali.
Mari kita lihat komponen-komponen berikutnya, untuk mendapatkan sedikit pemahaman tentang bagaimana halaman-halaman ini disusun.
Di KNIME Analytics Platform, kami menyebut makro sebagai "komponen". Komponen-komponen ini dapat disimpan secara lokal atau di server untuk penggunaan dan pembagian berulang. Lakukan ini dengan mengklik kanan komponen Anda, memperluas baris komponen, lalu memilih opsi "Bagikan..."
(lihat gambar di sebelah kanan).
Untuk membuat komponen yang ditujukan untuk penggunaan lokal, satu-satunya tambahan utama adalah satu (atau beberapa) node konfigurasi, yang ditemukan di folder Abstraksi Alur Kerja di Repositori Node. Node konfigurasi ini berperilaku seperti beberapa widget lainnya dengan satu pengecualian. Alih-alih ditampilkan di aplikasi data,
Aplikasi data ini dibangun dengan cara yang sama seperti Anda membangun alur kerja apa pun di KNIME Analytics Platform dan kemudian diterapkan ke KNIME Business Hub untuk digunakan.
komponen terpisah dalam alur kerja Anda. Hal ini memungkinkan pengguna untuk berpindah melalui seluruh alur kerja pada titik interaksi tertentu yang telah Anda tentukan. Contoh yang ditampilkan di atas memungkinkan pengguna untuk mengunggah berkas data pilihan mereka dan kemudian membuat visualisasi khusus. Hal ini sangat cocok untuk mempercepat desain presentasi bagi tim pemasaran atau penjualan!
keluar. Tampilan yang Anda lihat adalah satu komponen, dan, saat Anda terus bergerak melalui aplikasi data, setiap halaman baru didasarkan pada
node konfigurasi ditampilkan di jendela konfigurasi komponen. Hal ini membuat komponen berperilaku seperti node KNIME biasa.
Kontrol Alur Kerja
Komponen (Makro)
Node widget
Pemilihan memungkinkan pengguna untuk mengatur hal-hal seperti parameter filter, atau kolom untuk pemrosesan.
Input memungkinkan pengguna untuk menyediakan variabel aliran untuk digunakan dalam alur kerja, ini bisa dalam bentuk pilihan dropdown untuk string, slider untuk nilai numerik, pemilih kalender untuk Tanggal & Waktu, dll. Input juga berisi node Widget Unggah File untuk memungkinkan pengguna menyediakan data mereka sendiri.
Widget dapat ditemukan di bawah Abstraksi Alur Kerja > Widget di Repositori Node. Widget hadir dalam beberapa kategori berbeda yang diwakili oleh subfolder yang Anda lihat di sebelah kanan: Input, Selection, Filter, dan Output.
Filter mencakup lebih banyak opsi interaktif untuk pemfilteran, yang dapat dikaitkan ke tampilan grafis untuk tampilan dinamis.
Node konfigurasi
Kontrol Alur Kerja
Tepat di atas Widget di Node Repository Anda akan melihat Konfigurasi
folder. Jika Widget digunakan untuk membuat tampilan interaktif untuk komponen atau aplikasi data Anda, simpul konfigurasi memungkinkan Anda membuat jendela
konfigurasi untuk komponen. Komponen Fast Fourier Transform (FFT) pada gambar di sebelah kanan memiliki jendela konfigurasi di sebelahnya. Ini adalah hasil dari penempatan simpul Konfigurasi Pemilihan Kolom , simpul Konfigurasi Pemilihan
Tunggal , dan simpul Konfigurasi Ganda di dalam komponen agar pengguna dapat berinteraksi dengannya.
Lingkaran
Node Awal Loop Rekursif:
Di bawah ini hanya ada tiga jenis tetapi masih ada beberapa jenis lagi yang tersedia yang dapat Anda jelajahi juga.
Node Group Loop Start bekerja seperti node GroupBy , yang telah kita bahas sebelumnya. Anda memilih sekumpulan kolom untuk digunakan
untuk mengelompokkan data Anda tetapi alih-alih
Gambar di atas menggunakan simpul Counting Loop Start yang hanya mengulang sejumlah kali yang dapat Anda tentukan di jendela konfigurasi. Mari kita lihat beberapa jenis pengulangan lain di KNIME agar Anda lebih memahami apa saja yang mungkin dilakukan.
Node Awal Loop Grup:
menggabungkan simpul awal dan simpul akhir loop, yang keduanya tersedia dalam beberapa jenis. Simpul yang ditempatkan di antara simpul awal dan simpul akhir ini akan dieksekusi hingga kondisi yang Anda tentukan terpenuhi.
Loop adalah bagian dari alur kerja Anda yang akan dijalankan beberapa kali. Ini bisa berupa sejumlah waktu tertentu, hingga setiap baris dalam tabel diproses, hingga beberapa kondisi variabel terpenuhi, atau bahkan tanpa batas waktu. Di KNIME Analytics Platform, loop dibuat dengan
Node Awal Loop Rekursif bersifat khusus karena merupakan satu-satunya jenis loop yang dapat meneruskan data kembali ke awal untuk digunakan pada iterasi berikutnya. Node ini harus dipasangkan
tidak menyediakan data untuk setiap iterasi seperti yang lain. Sebaliknya, ia mengiterasi setiap baris tabel yang menyediakan nilai-nilai di dalam baris tersebut sebagai variabel aliran. Penggunaan populer dari simpul ini adalah menggabungkannya dengan simpul Daftar Berkas dan simpul Pembaca Excel untuk membaca dan menggabungkan seluruh direktori berkas dengan mudah.
Node Awal Baris Tabel ke Loop Variabel Baris Tabel ke Node Awal Loop Variabel:
Kontrol Alur Kerja
simpul. Mari kita lihat contoh dasar dan kemudian contoh penggunaan loop.
Dalam contoh alur kerja di bawah ini, variabel alur awalnya dibuat oleh simpul Konfigurasi String . Simpul ini hanya memungkinkan pengguna untuk mengetik string yang akan menjadi variabel. Dalam alur kerja ini, string tersebut akan mewakili nama file Excel yang akan ditulis. Variabel alur ini kemudian diteruskan ke simpul Buat Nama File yang mengambil string dan direktori dan membuat URL nama file. Kita kemudian akan meneruskan jalur file ke Excel Writer (XLS) dan menggunakannya untuk secara otomatis menyetel lokasi dan nama file yang kita tulis. Di jendela konfigurasi, klik V di samping lokasi output (lihat gambar di sebelah kiri) untuk mengendalikannya dengan variabel, lalu pilih variabel yang dibuat,
filePath dalam kasus ini, dan pengaturan akan dikontrol secara dinamis. Sempurna!Dua aplikasi paling penting untuk variabel aliran adalah konfigurasi loop dan komponen menggunakan konfigurasi
Variabel aliran digunakan dalam KNIME untuk membuat parameter alur kerja saat Pengaturan Node perlu ditentukan secara dinamis. Variabel aliran dibawa sepanjang cabang dalam alur kerja melalui tautan data (garis hitam di antara node) dan melalui tautan variabel eksplisit (garis merah di antara node). Port variabel aliran dapat diaktifkan pada node mana pun melalui Klik Kanan > Tampilkan Port Variabel.
Variabel Aliran
Contoh 1, Intro:
Contoh 2, Loop:
Kontrol Alur Kerja
Bahasa Indonesia: Dalam alur kerja ini, Anda melihat bahwa alih-alih membuat variabel aliran secara manual dengan simpul konfigurasi, garis variabel merah dimulai pada simpul Baris Tabel ke Awal Loop Variabel (kami membahas simpul ini secara singkat di bagian tentang loop). Ini mengonversi setiap kolom tabel menjadi variabel dan kemudian mengulanginya satu baris pada satu waktu. Ini memungkinkan Anda untuk membangun alur kerja yang melakukan banyak tugas serupa dengan cepat dan mudah. Dalam kasus ini, kami meneruskan variabel ke simpul pengelompokan k-Means yang memungkinkan nilai yang berbeda untuk parameter k (= jumlah kluster) dan di akhir loop, kami mengumpulkan
informasi itu bersama dengan beberapa informasi dari simpul Entropy Scorer . Itu membantu kami memutuskan cara terbaik untuk mengelompokkan data kami.
Contoh alur kerja ini tersedia di ruang Contoh di Pusat Komunitas KNIME atau dalam Contoh KNIME, repositori alur kerja dan komponen yang siap dieksekusi pada beberapa data yang tersedia langsung di KNIME Explorer Anda, di bawah 06_Struktur Kontrol > 04_Loop >
01_Loop_over_a_set_of_parameter_for_k_means.
Platform Analisis KNIME
ÿ
Catatan
ÿ
ÿ
Alteriks
ÿ
Tipe Data
ÿ ÿ
ÿ
ÿ ÿ
ÿ ÿ
ÿ
ÿ
ÿ ÿ
ÿ
Tipe Data yang Tersedia
Lampiran
Rangkaian
Alteryx memiliki beberapa opsi untuk efisiensi penyimpanan
Objek Spasial Tanggal dan/atau Waktu
KE DALAM
Tanggal, Waktu, atau Tanggal / Waktu Keduanya memiliki beberapa opsi untuk
presisi Bool
Bilangan Kompleks
Nominal Desimal
Titik, Garis, dan Poligon
ÿ
ÿ
ÿ ÿ
ÿ
ÿ
Lampiran
Dokumen
Koleksi
Termasuk teks dan meta data untuk penambangan teks Gambar
Daftar nilai dalam sel tabel tunggal
Menyaring
Node Nilai Hilang Jelajahi
Rumus Data Keluaran
Masukan Teks
Buat simpul Tabel Node Penjelajah Data
Pembersihan Data
simpul Penulis Excel
Node Manipulasi String Node Pembaca File Data Masukan
Node Filter Baris
Platform Analisis KNIME Alteriks
Alat Cepat untuk Referensi Node
(Alternatif: Node Penulis Tabel atau Node Penulis DB)
(Alternatif: Node Input String (lama))
(Alternatif: node DB Reader, node Tika Parser, atau node Hive/ Impala Connector) (Alternatif: Node statistik)
(Alternatif: Node Manipulasi String)
(Alternatif: Node Filter Baris Berbasis Aturan atau Node Pemisah Baris)
(Alternatif: Node Penggantian Nama Kolom atau Node Pengurut Kolom)
(Alternatif: simpul Cross Joiner) (Node partisi)
(Alternatif: Node Pengambilan Sampel Bootstrap, Node Pengambilan Sampel Ukuran yang Sama, atau
(Alternatif: Node Binner Numerik, Node Binner (Kamus), atau Node Binner CAIM)
(Alternatif: Node Penulis Gambar (Port)) (Alternatif: Node Mesin Aturan)
Lampiran
Bergabung
Node Nilai Hilang Node Filter Kolom
Serikat Mencicipi
Ubin
Gabungkan simpul
Menyortir
Kelompokkan berdasarkan simpul
Tuduhan
Node pengurut
Node Binner Otomatis
Memberikan
simpul penyambung Node Pengambilan Sampel Baris
Teks ke Kolom
Meringkaskan
Node tabel ke PDF Memilih
Node Pemisah Sel
• KNIME Community Hub: Tempat yang sempurna untuk mencari node atau contoh alur kerja saat Anda tidak yakin apa yang Anda cari.
• KNIME TV: Saluran YouTube kami sendiri yang memuat segala hal, mulai dari berita komunitas hingga webinar, hingga pelajaran mini.
belum butuh.
https://www.youtube.com/user/KNIMETV
• FAQ: Kumpulan beberapa pertanyaan yang paling sering diajukan, lihat forum jika jawaban Anda tidak ada di sini!
• Learning Hub: Tempat utama untuk mengakses materi pendidikan untuk membantu Anda memulai dengan KNIME https://www.knime.com/learning
https://forum.knime.com/
• Acara dan Kursus: Informasi tentang semua acara mendatang kami termasuk kursus, webinar, learnathon, dan pertemuan puncak.
• Blog: Kumpulan postingan blog yang membahas ilmu data dengan KNIME, ruang yang bagus untuk mempelajari apa yang sebenarnya dapat dilakukan KNIME.
https://www.knime.com/acara https://www.knime.com/blog
• KNIME Press: Informasi tentang semua buku kami yang tersedia, seperti yang ini!
• Forum: Datang ke sini untuk terlibat dalam diskusi komunitas, mengirimkan permintaan fitur, meminta bantuan, atau membantu orang lain sendiri!
https://www.knime.com/knimepress https://www.knime.com/faq
https://hub.knime.com/
Tautan Berguna
Lampiran