Setiap Orang yang tanpa hak dan/atau izin Pencipta atau Pemegang Hak Cipta melanggar hak ekonomi Pencipta sebagaimana dimaksud dalam Pasal 9 ayat (1) huruf c, huruf d, huruf f dan/atau huruf h untuk tujuan komersial. penggunaannya dipidana dengan pidana penjara paling lama 3 (tiga) tahun dan/atau denda paling banyak Rp lima ratus juta rupiah). SOMLib..88 Gambar 9.2 Dokumen dalam format HTML diekstrak dari file “democollection.tar.gz” ..89 Gambar 9.3 Hasil pengolahan pada folder “C:\SOMLib\.
Model jaringan saraf tanpa pengawasan yang paling populer adalah “Kohonen Maps” atau “Self-Organizing Maps SOMs” (Stevanovic et al., 2013). Jumlah data yang luar biasa besar yang disimpan dalam database besar dengan pertumbuhan pesat telah melampaui kemampuan manusia.
- Business Understanding
- Data Understanding
- Data Preparation
- Modeling
- Evaluation
- Deployment
Penambangan data deskriptif, yang menghasilkan informasi baru dan non-sepele dari data yang tersedia. Tugas data mining berdasarkan pendapat Larose & dan Larose (2014) Larose & dan Larose (2014) adalah sebagai berikut.
Training Processes and Properties of Learning
Salah satu fitur terpenting dari ANN adalah kemampuannya untuk belajar (learning) dari penyajian sampel (model), yang mengekspresikan suatu sistem perilaku (Nunes et al., 2017). Kumpulan langkah-langkah terkoordinasi yang digunakan untuk melatih jaringan disebut algoritma pembelajaran.
Fungsi Aktivasi
Dari proses pembuatan deskripsi tersebut maka terciptalah file “map.lib” pada folder “C:\SOMLib”, yang bila dilihat dengan Wordpad akan muncul tampilan seperti berikut.
Metodologi SOM
Semua input unit terhubung ke semua node di peta, dan hubungan setiap input ke node diwakili oleh bobot. Setiap entri unit sesuai dengan satu kolom masukan, dan biasanya semua entri unit diwakili oleh nilai biner (0 atau 1), nilai bipolar (-1 atau +1), atau nilai bilangan real (seperti 0 hingga 1). Kumpulan nilai ini diasumsikan oleh unit masukan individu dalam siklus pelatihan tertentu dan diwakili oleh vektor masukan, yang merupakan nilai spesifik dari unit masukan dalam siklus tersebut.
Keberhasilan pelatihan adalah jika pola masukan beradaptasi dengan bobot yang berbeda pada setiap node pada peta. Bobot seluruh node pada lingkungan dengan jarak terkecil (winning node) kemudian diupdate menggunakan aturan pembelajaran (Clark & Ravishankar, 1990).
Metodologi Penandaan SOM
Untuk setiap cluster node, hapus/buang node outlier yang sangat berbeda dari pusatnya. Untuk setiap cluster node (setelah menghapus outlier), urutkan kumpulan sampel pelatihan (sebelum memberi label), dengan mempertimbangkan sampel masuk atau keluar tergantung pada apakah node terdekat ada di peta dan di cluster atau tidak. Berdasarkan dimensi yang menonjol, tentukan label deskriptif untuk setiap kelompok node yang dapat memberikan makna pada area yang diamati.
Saat mengelompokkan node ke dalam cluster dari vektor bobot referensi yang serupa, masalah utamanya adalah menentukan jumlah cluster yang sesuai/cukup. D adalah dimensi data dan wj adalah j. komponen vektor bobot referensi untuk node sembilan, salah satu node di Γk.
SOM Toolbox Requirements
Browser seperti Google Chrome, Mozilla Firefox, Microsoft Edge atau Safari membaca instruksi dalam format HTML yang disertakan dalam paket SOM Toolbox.
Langkah-langkah penggunaan SOMs Toolbox
Tujuan yang diharapkan adalah membuat properti untuk melakukan pelatihan pada file demo yang ada yaitu file vektor bobot (GrowingSOM) dan melihat hasilnya (SOMViewer). Keberhasilan pelatihan SOM yang dilakukan terlihat dari terbentuknya file output pada direktori yang ditentukan pada file properti “som.prop” yaitu pada folder “output”. Folder "output" yang ditentukan dalam "som.prop" bersifat relatif dan dalam hal ini dibuat di folder "C:\SOMToolbox\doc\demo-vectors\output".
Dalam folder ini, selama proses pelatihan SOM, empat file dengan nama (awalan nama) yang ditentukan dalam "som.prop" dibuat. Dengan terbentuknya 4 (empat) file, maka hasilnya dapat dilihat dengan menjalankan SOMViewer menggunakan perintah, dalam hal ini perintah tersebut disimpan dalam file yang berekstensi “.bat” masing-masing.
Iris Dataset
Keberhasilan pelatihan yang dilakukan adalah terbentuknya file keluaran pada direktori yang ditentukan pada file properti “iris.prop”, yaitu pada folder “maps\iris”. Folder "output" yang ditentukan dalam "iris.prop" bersifat relatif dan dalam hal ini dibuat di dalam folder tersebut. Dalam folder ini, selama proses pelatihan SOM, empat file dengan nama (awalan nama) yang ditentukan dalam "iris.prop" dibuat.
Dengan terbentuknya keempat file tersebut, hasilnya dapat dilihat dengan menjalankan SOMViewer menggunakan perintah. Dalam hal ini, perintah disimpan dalam file berekstensi ".bat" yaitu "iris_somviewer. Dengan menggabungkan file vektor input (iris.vec), file vektor template (iris.tv), file pemetaan data pemenang (iris.dwm.gz) dan file informasi kelas (iris.clsinf), visualisasinya berupa Smoothed Data Histograms (SDH) yang merepresentasikan jarak.
Boston Housing Dataset
Keberhasilan pelatihan yang dilakukan terlihat dari terbentuknya file keluaran pada direktori yang ditentukan pada file properti “boston-housing.prop” yaitu pada direktori. Dalam folder ini, selama proses pelatihan SOM, empat file dibuat dengan awalan nama yang ditentukan dalam "boston-housing.prop". C:\SOMToolbox>somtoolbox SOMViewer -u doc\datasets\maps\boston-housing\boston-ho menggunakan.unit.gz -w doc\datasets\maps\boston-housing\boston-housing.wgt.gz --dw doc .
Artificial Dataset
Keberhasilan pelatihan yang dilakukan adalah terbentuknya file keluaran pada folder yang ditentukan pada file properti. Empat file dibuat di folder ini selama proses pelatihan SOM dengan awalan nama yang ditentukan di "chainlink.prop". Dengan terbentuknya keempat file tersebut, hasilnya dapat dilihat dengan menjalankan SOMViewer menggunakan perintah. Dalam hal ini, perintah disimpan dalam file dengan ekstensi ".bat" yaitu "chainlink_.
C:\SOMToolbox>somtoolbox SOMViewer -u doc\datasets\maps\chainlink\chainlink.unit .gz -w doc\datasets\maps\chainlink\chainlink.
Bekerja dengan Text Data File
File berpemilik seperti “som.prop” yang digunakan pada subbagian II adalah file yang diperlukan untuk menyimpan informasi dan digunakan selama proses pelatihan SOM. Dalam hal ini, file properti bernama random.prop", yang isinya sebagai berikut: Templat file vektor pada dasarnya menggambarkan dimensi ruang fitur yang dimilikinya dan dapat digunakan untuk mendefinisikannya. memberi label pada klaster dengan memilih pengidentifikasi dimensi yang paling umum untuk klaster tersebut.
VECDIM menentukan dimensi ruang fitur (dalam hal ini ada lima, yaitu: nomor seri, usia, tinggi badan, berat badan, dan jenis kelamin). Data file teks yang dihasilkan dari script program seperti pada gambar di bawah (kiri) dan file vektor seperti pada gambar di sebelah kanan.
Keberhasilan pelatihan yang dilakukan adalah terbentuknya file output pada direktori yang ditentukan pada file properti “chainlink.prop”, yaitu pada folder “random”. Dengan terbentuknya keempat file tersebut, maka dapat dilihat hasilnya dengan menjalankan SOMViewer menggunakan perintah, yang mana perintah tersebut akan disimpan dalam file yang berekstensi ".bat" yaitu "random_somviewer. IfS Departemen Teknologi Perangkat Lunak (1999 ) menyatakan bahwa SOMLib Digital Library merupakan pengembangan dari sistem perpustakaan digital yang mendukung penelusuran koleksi dokumen secara intuitif dan mudah digunakan.
Perpustakaan digital yang dimaksud secara fisik dapat berupa informasi apa saja (html, email, dokumen berformat (pdf, ps, doc, xls, ppt, dll). Metodologi yang akan disajikan disini adalah bagaimana membuat sistem perpustakaan digital untuk membangun yang tidak hanya mengumpulkan informasi ini, tetapi merupakan sistem yang memudahkan untuk mengakses informasi ini atau mencari informasi ini.
Preprocessing
Jika file yang akan diproses terletak di lokasi yang jauh (misalnya di Internet atau di folder bersama di jaringan), sebelum Java somlib.ui.Bookmarks dimulai, file bookmark harus dibuat. Hal ini dilakukan karena file yang akan diproses belum dimiliki oleh proses dan akan diunduh ke “Direktori Buffer”. Sebelum menjalankan java aslib.ui.Bookmarks ke lokasi remote di sistem operasi Windows, Anda harus menggunakan program "wgetfor Windows”.
Pertama siapkan file yang diperlukan untuk preprocessing yaitu SOMLIB.tar.gz, democollection.tar.gz dan html2txt. Kemudian ekstrak file kompresi "SOMLIB.tar.gz" dan pindahkan file hasil ekstrak "SOMLIB.tar.gz" ke folder kerja yang diinginkan.
Text Representation
Representasi yang lebih canggih dapat dicapai dengan menghitung jumlah kemunculan setiap kata dalam vektor templat di setiap dokumen, sehingga menghasilkan histogram kata yang representatif untuk setiap dokumen. Berbagai ukuran dapat digunakan untuk menentukan pentingnya setiap kata dalam setiap dokumen berdasarkan representasi frekuensi istilah dokumen. Pilihan paling umum untuk melakukan hal ini adalah apa yang disebut representasi istilah frekuensi kali frekuensi dokumen terbalik (tf x idf), dalam hal ini makna setiap kata dinilai berdasarkan jumlah dokumen yang ada.
Secara sederhana, representasi tf x IDF untuk setiap kata dapat diperoleh dengan membagi frekuensi suku dalam kata tersebut. Namun saat ini, sebagian besar sistem menggunakan versi sederhana dari representasi tf x IDF, yang memberi bobot pada setiap kata dengan mengalikan frekuensi istilah dengan logaritma natural (N/df), di mana N adalah jumlah dokumen dalam koleksi dan df adalah jumlah frekuensi dokumen adalah. , yaitu jumlah dokumen yang memuat kata-kata ini setiap kali.
Parsing
Pada modul “Plaintext to n-grams”, isi entry “Plaintext Directory” dengan “C:\SOMLib\files_clean”, yang merupakan lokasi data plaintext. Pada tahap ini histogram akan diterjemahkan ke dalam template vektor yang merupakan gabungan dari file-file yang dibuat pada langkah terakhir menjadi satu file “Template Vector”. Reduced.tv', yaitu file template vektor hasil penggabungan file histogram.
Pada tahap ini masing-masing vektor akan diekstraksi, yaitu "Vektor Template Tereduksi" dan berbagai file histogram harus disesuaikan. File Vektor Individu” dengan “C:\SOMLib\template vector\MyTest_1” yang merupakan file vektor keluaran hasil pengolahan kata.
SOM Modul (Training)
Dengan menggunakan aplikasi ini, peta SOM dapat dilatih menggunakan vektor pelatihan yang disimpan dalam file vektor masukan SOM-Input-Vector_in dengan deskripsi masukan vektor. Saat melakukan pemetaan, peta yang telah dilatih sebelumnya dimasukkan ke dalam parameter SOM-Map-Description_in. Deskripsi file peta SOM yang baru ditulis dalam SOM-Map-Description_out, SOM Weight Vector ditulis dalam SOM-Weight-Vector_out, deskripsi node SOM ditulis dalam SOM-Node-Description_out dan file peta SOM adalah ditulis dalam SOM-Mapping-File_out.
Map: writing SOM map description File Map: storing SOM weight vectors Map: storing SOM entity descriptions Map: writing SOM quantization errors Map Map: writing map file. Sebagai hasil dari proces mapping ini adalah tupatidinya file “mapdescrmap.map”, “weightvec.wgt”, “quanterrmap.err”,.
Advances in Intelligent Systems and Computing 976 Advances in Self-Organizing Maps, Vector Quantization Learning, Clustering, and Data Visualization. Discovering Knowledge in Data An Introduction to Data Mining The second edition of the Wiley series on methods and applications in data mining. Self-organizing mappings on a flag splitter with applications to hyperspectral image data analysis”.
Analysis of spatial distribution relationships of the coronavirus pandemic (COVID-19) in the world using self-organizing maps. An Artificial Neural Network Approach for Short-Term Load An Artificial Neural Network Approach for Short-Term Load Forecasting for the Nigerian Power Grid.