DESAIN DAN PENGEMBANGAN VISUALISASI DATA DAN MACHINE
9.2 MEMAHAMI VISUALISASI DATA
Meskipun whitepaper seperti “Analisis Biaya-manfaat dari Visualisasi di Virtual Environment (VEs)” IEEE mempertanyakan relevansi dan tujuan visualisasi dalam XR, menanyakan “apakah kita benar-benar membutuhkan visualisasi 3D untuk data 3D?” Secara sederhana, dasar bab ini mengasumsikan dari awal bahwa penggunaan VE memungkinkan pemahaman yang lebih baik tentang data 3D, dengan konteks yang sesuai, desain yang matang, dan pengembangan.
Pertama, kami menjelaskan dan mendefinisikan visualisasi data dalam XR dan apa yang membuatnya unik untuk media lain sebelumnya. Kami melihat perbedaan antara visualisasi data besar interaktif versus representasi infografis murni.
Dianggap sebagai bapak baptis visualisasi data, ahli statistik Edward Tufte menulis bahwa selama berabad-abad pelukis, animator, dan arsitek telah berusaha untuk
merepresentasikan data (2D dan 3D) pada berbagai tampilan (terutama dalam ruang 2D), menggunakan perspektif dan gerakan. Perhatikan bahwa banyak infografis statis kurang gerak atau pemahaman umum tentang perspektif dan dengan demikian tidak memenuhi syarat sebagai "visualisasi data yang baik" dalam komputasi spasial; pengalaman sebagian besar pasif dan tidak memungkinkan rotasi atau prinsip lain yang dibahas nanti dalam bab ini. Visualisasi data dan machine learning memungkinkan pengguna untuk melihat, menjelajahi, dan memahami data dengan lebih baik. Seperti yang dikatakan oleh Fernanda Viegas dan Matt Wattenberg (Orang Google dan Peneliti AI yang berfokus pada visualisasi data) di NeuralIPS 2018, visualisasi data mengubah data menjadi pengkodean visual yang membantu pengguna mendidik, berkomunikasi, memberikan insight, dan menjelajahi data dengan lebih baik. Tanpa visualisasi, data hanyalah angka mati pada sebuah halaman.
Dalam buku maninya, Tampilan Visual Informasi Kuantitatif (Graphics Press, 2001), Tufte menulis bahwa visualisasi data membuat pemahaman manusia tentang kumpulan data besar lebih koheren. Ini melayani tujuan yang jelas untuk menggambarkan data yang direpresentasikan dalam berbagai bentuk; misalnya, sebagai abstraksi (bagan pai, diagram batang, dll.) dan sering sebagai istilah untuk menggambarkan rekonstruksi data 3D sebagai objek dalam ruang 3D (misalnya, struktur anatomi yang direkonstruksi 3D seperti data otak, dan irisan datar pencitraan resonansi magnetik [MRI] file dalam lingkungan augmented dan virtual). Data itu sendiri bersifat komparatif, relasional, multivariat, dan dapat memungkinkan pengguna untuk menanyakan pertanyaan spesifik atau menjelajahi data secara umum untuk mendapatkan pemahaman yang lebih baik tentang kualitasnya. Berikut adalah beberapa karakteristik utama dari visualisasi data interaktif di XR:
Ini dapat memplot dan mengurutkan data relasional melalui pengintegrasian deskripsi untuk membedakan data kategoris, apakah itu data kualitatif dan dapat melibatkan beberapa sifat statistik (fokus pada data kuantitatif).
Ini melibatkan arsitektur informasi yang menunjukkannya sebagai dinamis dan memberikan interaktivitas kepada pengguna.
Ini menekankan estetika untuk membantu pengguna memahami data melalui desain yang baik, tidak hanya untuk tujuan dekorasi.
Data jauh lebih sulit dipahami tanpa visualisasi. Seperti yang dikatakan oleh peneliti pembelajaran mendalam, “visualisasi data dan analitik visual dapat digunakan untuk unggul dalam komunikasi pengetahuan dan penemuan insight dengan menggunakan pengkodean untuk mengubah data abstrak menjadi representasi yang bermakna.”
Interaktivitas dan animasi di semua platform, desktop, seluler, dan komputasi spasial membantu pengguna membuat data lebih mudah diakses dan lunak dengan manipulasi langsung dengan berbagai set input dan kontrol.
Prinsip untuk Visualisasi Data dan Pembelajaran Mesin dalam Komputasi Spasial
Merujuk kerangka kerja oleh peneliti pembelajaran mendalam,6 pembuat visualisasi data dan pembelajaran mesin dalam komputasi spasial harus mengeksplorasi lima W yang
akan membantu memberi mereka landasan untuk menciptakan pengalaman aplikasi yang sukses dalam komputasi spasial.
Pembuat konten harus mempertimbangkan desain pengalaman pengguna mereka dengan memulai dengan hal berikut: mengidentifikasi pengguna target mereka (Siapa) dan di mana tepat untuk menggunakan visualisasi data (Kapan), jenis visualisasi data yang dibuat (Apa), membenarkan keberadaannya sebagai optimal dalam komputasi spasial dan Mengapa sebelum mereka mengidentifikasi metode atau (jenis visualisasi apa) yang melibatkan atau tidak melibatkan pembelajaran mesin sebelum mereka mulai memilih Tempat menyimpan, memproses, memvisualisasikan data ini sebelum memilih Bagaimana (bahasa mana yang digunakan untuk platform mana) .
Kami mengeksplorasi lebih lanjut tentang pendekatan pada metode dan cara membuat visualisasi aktual di akhir bab ini, di mana kami mempertimbangkan rekayasa data- ke-visualisasi holistik dan proses desain pipa. Berikut adalah contoh dari prinsip-prinsip dalam praktek. Lebih khusus lagi, pencipta harus mempertimbangkan faktor-faktor ini untuk disengaja tentang proses pembuatan visualisasi mereka:
Identifikasi tujuannya, tanyakan pada diri Anda mengapa visualisasi data atau pembelajaran mesin ini masuk akal dalam komputasi spasial versus komputasi lainnya. Pencipta harus mempertimbangkan interaksi sehingga pengguna dapat secara langsung memanipulasi dan membuka insight lain untuk mendapatkan pengalaman visualisasi data yang efektif yang tidak mungkin dilakukan di media lain.
Mengapa
Tentukan target pengguna akhir dari data atau visualisasi pembelajaran mesin pengalaman/aplikasi komputasi spasial dan manfaat apa yang akan mereka peroleh dari pengalaman mereka dalam komputasi spasial (misalnya, ahli bedah yang memantau data otak dan informasi struktur anatomi lainnya). Kami akan membahas hal ini secara rinci saat kami menjelaskan kategori data dan bagaimana jenis interaksi yang bergantung pada platform pilihan telah berkembang dari waktu ke waktu untuk berbagai visualisasi pada Gambar 9-4.
Apa
Pilih cakupan dan ukuran tipe data, seberapa besar, dan seberapa banyak yang ingin mereka visualisasikan. Untuk data MRI spesifik pasien dengan tumor kanker). Tidak semua data otak sama; misalnya, untuk kumpulan data yang lebih besar yang melibatkan pencitraan otak, dalam ruang pemetaan otak dan konektivitas, para peneliti di Spanyol memilih untuk memvisualisasikan subset data multidimensi untuk visualisasi komputasi spasial menggunakan Unity.
Di mana
Pilih platform komputasi spasial yang paling tepat untuk menargetkan Head Mounted Display (HMD) atau tampilan seluler. Pertimbangkan berbagai alat pembuatan prototipe dalam 2D (lihat di bagian sumber daya di akhir bab ini) pada platform komputasi non-spasial (desktop dan seluler) jika memungkinkan. Pembuat harus memahami kompleksitas data sehingga mereka tahu apakah itu harus diproses sebelumnya dan di mana disimpan dan disimpan (di cloud menggunakan Amazon Web Services, dalam format JSON). Ini mungkin atau mungkin
tidak melibatkan beberapa pembuatan prototipe (terkadang ini melibatkan penggunaan 3D dengan alat 2D), sebelum memuat dan memvisualisasikan data sepenuhnya dalam XR.
Bagaimana
Pilih metode yang akan digunakan saat Anda membuat visualisasi data atau machine learning.
Visualisasi dasar tidak memerlukan banyak pra-pemrosesan, tetapi bagi mereka yang melakukannya (seringkali yang menggunakan Python) seluruh jalur pipa harus dipertimbangkan. Pilih bahasa pemrograman lain yang akan Anda gunakan untuk platform yang dipilih untuk memvisualisasikan data (mis. C#, C++, JavaScript) dan program Lingkungan Pengembangan Terpadu (IDE) mana yang akan digunakan untuk (Unity, Unreal Engine, mesin game lain, mesin milik Anda sendiri untuk membuat, buku ini menampilkan contoh-contoh terutama dari IDE pertama).
Beberapa visualisasi data dibuat untuk penggunaan praktis yang membantu profesional pemasaran, analis bisnis, dan eksekutif dengan mampu menampilkan dan berinteraksi dengan data, mengarahkan mereka ke keputusan bisnis yang lebih baik. Lainnya mungkin insinyur pembelajaran mesin, ilmuwan data, atau insinyur perangkat lunak yang berusaha menemukan teknik optimasi, mengeksplorasi interpretasi model dan dapat membuat penemuan ini melalui eksplorasi visualisasi komputasi spasial. Mereka dapat melihat lebih baik lapisan yang mendasari data multidimensi yang lebih kompleks dalam komputasi spasial daripada media lain. Di sini visualisasi berfungsi sebagai solusi untuk
"kutukan dimensi", yang berarti memadatkan data multidimensi ke dalam format yang lebih dapat dipahami.
Di ujung lain spektrum, beberapa visualisasi sering salah dikategorikan sebagai visualisasi data dan sebenarnya termasuk dalam spektrum presentasi dan desain infografis dan dipandang sebagai karya eksperimental artistik yang “indah”; mereka dianggap diciptakan untuk tujuan dekoratif murni, atau lebih untuk nilai estetika dan apresiasi daripada untuk penggunaan praktis. Kami masuk ke detail tentang ini saat kami menggambarkan kategori data pada Gambar 9-4 nanti dalam bab ini.
Mengapa Visualisasi Data dan Pembelajaran Mesin Bekerja di Komputasi Spasial
Kami mempelajari topik ini lebih dalam saat kami menjelaskan evolusi desain visualisasi data, bagaimana tujuannya telah meningkat dan berkembang dengan diperkenalkannya komputasi spasial sebagai media tujuannya, berbagai kategorisasi data dan desain interaksi yang efektif.’