MENGGUNAKAN HARDWARE GRAFIS
BAB 7 PERSEPSI VISUAL
7.6 VISI SPASIAL
Televisi siaran nonHDTV standar menggunakan kecepatan refresh 60 Hz (NTSC, digunakan di Amerika Utara dan beberapa lokasi lain) atau 50 Hz (PAL, digunakan di sebagian besar belahan dunia lainnya). Kecepatan pembaruan bingkai adalah setengah dari kecepatan refresh. Alih-alih menampilkan setiap gambar baru dua kali, tampilan tersebut saling terkait dengan membagi garis horizontal gambar bolak-balik menjadi bidang genap dan ganjil dan tampilan bidang genap dan ganjil ini bergantian. Kedipan dihindari dalam film dengan menggunakan rana mekanis untuk mengedipkan setiap bingkai film tiga kali sebelum pindah ke bingkai berikutnya, menghasilkan kecepatan refresh 72 Hz sambil mempertahankan kecepatan pembaruan bingkai 24 Hz.
Penggunaan gerakan semu untuk mensimulasikan gerakan kontinu terkadang menghasilkan artefak yang tidak diinginkan. Yang paling terkenal dari ini adalah ilusi roda gerobak di mana jari-jari roda yang berputar tampak berputar ke arah yang berlawanan dari apa yang diharapkan mengingat gerakan translasi roda. Ilusi roda gerobak adalah contoh aliasing temporal. Jari-jari, atau pola periodik spasial lainnya pada piringan yang berputar, menghasilkan sinyal periodik temporal untuk melihat lokasi yang tetap terhadap pusat roda atau piringan. Tingkat pembaruan bingkai tetap memiliki efek pengambilan sampel sinyal periodik temporal ini dalam waktu. Jika frekuensi temporal dari pola sampel terlalu tinggi, hasil undersampling di alias, frekuensi temporal yang lebih rendah muncul saat gambar ditampilkan. Dalam beberapa keadaan, distorsi frekuensi temporal ini menyebabkan distorsi spasial di mana roda tampak bergerak mundur. Ilusi roda gerobak lebih mungkin terjadi dengan film dibandingkan dengan video, karena tingkat pengambilan sampel temporal lebih rendah.
Masalah juga dapat terjadi ketika gambar gerak semu diubah dari satu media ke media lainnya. Ini menjadi perhatian khusus ketika film 24 Hz ditransfer ke video. Tidak hanya format non-interlaced yang perlu diterjemahkan ke format interlaced, tetapi tidak ada cara langsung untuk berpindah dari 24 frame per detik ke 50 atau 60 bidang per detik. Beberapa perangkat tampilan kelas atas memiliki kemampuan untuk mengkompensasi sebagian artefak yang diperkenalkan saat film dikonversi ke video.
sangat jarang mungkin untuk secara unik menentukan sifat dunia yang menghasilkan pola bayangan tertentu dari cahaya.
Menentukan tata letak permukaan—lokasi dan orientasi permukaan yang terlihat di lingkungan—dianggap sebagai langkah kunci dalam penglihatan manusia. Sebagian besar diskusi tentang bagaimana sistem penglihatan mengekstrak informasi tentang tata letak permukaan dari pola cahaya yang diterimanya membagi masalah menjadi satu set isyarat visual, dengan setiap isyarat menggambarkan pola visual tertentu yang dapat digunakan untuk menyimpulkan sifat tata letak permukaan bersama dengan aturan inferensi yang diperlukan.
Karena tata letak permukaan jarang dapat ditentukan secara akurat dan jelas dari penglihatan saja, proses menyimpulkan tata letak permukaan biasanya memerlukan informasi nonvisual tambahan. Ini bisa datang dari indra atau asumsi lain tentang apa yang mungkin terjadi di dunia nyata.
Isyarat visual biasanya dikategorikan ke dalam empat kategori. Isyarat motorik okuler melibatkan informasi tentang posisi dan fokus mata. Isyarat disparitas melibatkan informasi yang diambil dari melihat titik permukaan yang sama dengan dua mata, di luar itu tersedia hanya dari posisi mata. Isyarat gerak memberikan informasi tentang dunia yang muncul baik dari pergerakan pengamat atau pergerakan objek. Isyarat bergambar dihasilkan dari proses memproyeksikan bentuk permukaan 3D ke pola cahaya 2D yang jatuh pada retina. Bagian ini berhubungan dengan isyarat visual yang relevan dengan ekstraksi informasi geometris tentang titik individu pada permukaan. Ekstraksi lebih umum informasi lokasi dan bentuk.
Kerangka Acuan dan Skala Pengukuran
Deskripsi lokasi dan orientasi titik pada permukaan yang terlihat harus dilakukan dalam konteks kerangka acuan tertentu yang menentukan asal, orientasi, dan skala sistem koordinat yang digunakan dalam merepresentasikan informasi geometrik. Sistem penglihatan manusia menggunakan banyak kerangka acuan, sebagian karena jenis informasi yang berbeda tersedia dari isyarat visual yang berbeda dan sebagian karena tujuan yang berbeda dari informasi tersebut (Klatzky, 1998). Representasi egosentris didefinisikan sehubungan dengan tubuh pemirsa. Mereka dapat dibagi lagi menjadi sistem koordinat yang dipasang pada mata, kepala, atau tubuh. Representasi allocentric, juga disebut representasi eksosentris, didefinisikan sehubungan dengan sesuatu di luar pemirsa. Kerangka acuan alosentris dapat bersifat lokal untuk beberapa konfigurasi objek di lingkungan atau dapat didefinisikan secara global dalam hal lokasi, gravitasi, atau properti geografis yang berbeda.
Jarak dari penonton ke lokasi tertentu yang terlihat di lingkungan, dinyatakan dalam representasi egosentris, sering disebut sebagai kedalaman dalam literatur persepsi. Orientasi permukaan dapat direpresentasikan dalam koordinat egosentris atau alosentris. Dalam representasi orientasi egosentris, istilah miring digunakan untuk merujuk pada sudut antara garis pandang ke titik dan permukaan normal pada titik tersebut, sedangkan istilah kemiringan mengacu pada orientasi proyeksi permukaan normal pada bidang yang tegak lurus dengan bidang. pandangan.
Jarak dan orientasi dapat dinyatakan dalam berbagai skala pengukuran. Deskripsi mutlak ditentukan menggunakan standar yang bukan merupakan bagian dari informasi yang dirasakan itu sendiri. Ini dapat berupa standar yang ditentukan secara budaya (misalnya,
meter), atau standar yang relatif terhadap tubuh penonton (misalnya, tinggi mata, lebar bahu).
Deskripsi relatif menghubungkan satu properti geometris yang dirasakan dengan yang lain (misalnya, titik a dua kali lebih jauh dari titik b). Deskripsi ordinal adalah kasus khusus ukuran relatif di mana hanya tanda, tetapi bukan besaran, dari hubungan yang diwakili. Tabel 20.1 memberikan daftar isyarat visual yang paling umum dipertimbangkan, bersama dengan karakterisasi dari jenis informasi yang berpotensi dapat mereka berikan.
Isyarat motorik okuler
Informasi motorik okuler tentang kedalaman dihasilkan langsung dari kontrol otot mata. Ada dua jenis informasi ocularmotor yang berbeda. Akomodasi adalah proses dimana mata secara optik memfokuskan pada jarak tertentu. Konvergensi (sering disebut sebagai vergensi) adalah proses di mana kedua mata diarahkan ke titik yang sama dalam ruang tiga dimensi. Akomodasi dan konvergensi memiliki potensi untuk memberikan informasi absolut tentang kedalaman.
Secara fisiologis, pemfokusan pada mata manusia dilakukan dengan mendistorsi bentuk lensa di bagian depan mata. Sistem penglihatan dapat menyimpulkan kedalaman dari jumlah distorsi ini. Akomodasi adalah isyarat yang relatif lemah untuk jarak dan tidak efektif lebih dari sekitar 2 m. Kebanyakan orang mengalami kesulitan yang semakin meningkat dalam memfokuskan diri pada rentang jarak yang jauh saat mereka mencapai usia sekitar 45 tahun.
Bagi mereka, akomodasi menjadi kurang efektif.
Mereka yang tidak akrab dengan spesifikasi persepsi visual terkadang mengacaukan estimasi kedalaman dari akomodasi dengan informasi kedalaman yang timbul dari kekaburan yang terkait dengan kedalaman bidang yang terbatas di mata. Isyarat kedalaman akomodasi memberikan informasi tentang jarak ke bagian bidang visual yang menjadi fokus. Itu tidak tergantung pada sejauh mana bagian lain dari bidang visual tidak fokus, selain itu blur digunakan oleh sistem visual untuk menyesuaikan fokus. Kedalaman lapangan tampaknya memberikan tingkat informasi kedalaman ordinal (Gambar 7.20), meskipun efek ini hanya menerima penyelidikan terbatas.
Jika dua mata terpaku pada titik yang sama dalam ruang, trigonometri dapat digunakan untuk menentukan jarak dari pengamat ke lokasi yang dilihat (Gambar 7.21). Untuk kasus yang paling sederhana, di mana tempat tujuan berada tepat di depan pemirsa,
Persamaan 7.5
𝑧 =𝑖𝑝𝑑/2 tan 𝜃
di mana z adalah jarak ke suatu titik di dunia, ipd adalah jarak antar pupil yang menunjukkan jarak antara mata, dan θ adalah sudut vergensi yang menunjukkan orientasi mata relatif terhadap lurus ke depan. Untuk kecil, yang merupakan kasus untuk konfigurasi geometris mata manusia, tan θ ≈ θ ketika dinyatakan dalam radian. Dengan demikian, perbedaan sudut vergensi menentukan perbedaan kedalaman dengan hubungan berikut:
Persamaan 7.6
∆𝜃 ≈𝑖𝑝𝑑 2 .1
∆𝑧
Saat θ → 0 dalam langkah seragam, ∆z semakin besar. Ini berarti bahwa penglihatan stereo kurang sensitif terhadap perubahan kedalaman saat kedalaman keseluruhan meningkat.
Konvergensi sebenarnya hanya memberikan informasi tentang kedalaman absolut untuk jarak beberapa meter. Di luar itu, perubahan jarak menghasilkan perubahan vergence yang terlalu kecil untuk berguna.
Gambar 7.20. Apakah bujur sangkar tengah muncul di depan pola lingkaran atau terlihat muncul melalui lubang bujur sangkar dalam pola lingkaran? Satu-satunya perbedaan dalam dua gambar adalah ketajaman tepi antara pola garis dan lingkaran (Marshall, Burbeck, Arely,
Rolland, dan Martin (1999), digunakan dengan izin).
Gambar 7.21. Vergensi kedua mata memberikan informasi tentang jarak ke titik di mana mata terpaku.
Ada interaksi antara akomodasi dan konvergensi dalam sistem visual manusia:
akomodasi digunakan untuk membantu menentukan sudut vergensi yang tepat, sedangkan vergensi digunakan untuk membantu mengatur jarak fokus. Biasanya, ini membantu sistem visual ketika ada ketidakpastian dalam pengaturan akomodasi atau vergensi. Namun, tampilan komputer stereografis memutuskan hubungan antara fokus dan konvergensi yang terjadi di dunia nyata, yang menyebabkan sejumlah kesulitan persepsi.