VISION
Pengertian Vision
Vision merupakan suatu aplikasi komputer, dimana didalamnya dapat
mencakup navigasi robot, tugas manufaktur yang rumit, analisis citra satelit,
pemrosesan citra medis, dsb.
Vision (visi) dapat diartikan sebagai suatu cara/teknik untuk
mentransfer sebuah citra menjadi informasi yang lebih berguna.
Citra (image) adalah apa yang ditangkap oleh suatu alat perekam
gambar
seperti kamera foto atau video.
Kamera video menyajikan komputer suatu citra yang
direpresentasikan sebagai butiran (titik-titik) dua dimensi dengan tingkat
intensitas (keabuan) yang berbeda-beda yang disebut pixel. Tiap pixel dapat
memiliki informasi tunggal (seperti hitam/putih) atau banyak informasi (seperti
nilai sebenarnya dari intensitas dan informasi warna).
Sebuah citra visual dapat terdiri dari ribuan pixel.
1. Signal
Processing (pemrosesan sinyal)
Mempertajam citra, baik untuk penglihatan manusia maupun sebagai
input untuk proses yang lainnya.
2. Measurement
Analysis (analisis ukuran)
Untuk citra yang berisi object tunggal, menentukan perluasan dua
dimensi dari object yang digambarkan.
3. Pattern
Recognition (pengenalan pola)
Untuk citra berisi object tunggal, mengklasifikasi object kedalam
kategori dari beberapa kemungkinan yang ada.
4. Image
Understanding (memahami citra)
Untuk citra yang berisi banyak object, mendapatkan lokasi object
dalam citra, mengklasifikasikannya, dan membentuk gambar model tiga dimensi.
Dari semua tugas pengolahan citra, pemahaman citra adalah yang
paling sulit, sehingga menjadi pembahasan pada banyak studi tentang AI.
Beberapa masalah yang dihadapi dalam pengolahan citra adalah :
1. Suatu citra
adalah dua dimensi (2-D), sementara semua object didunia ini adalah tiga
dimensi (3-D), sehingga sebagian informasi akan hilang pada saat kita merekam
object (3-D) ke dalam citra (2-D).
2. Suatu citra
mungkin berisi beberapa object, dan tiap object dapat terdiri dari beberapa
bagian lagi.
3. Nilai dari tiap
pixel dipengaruhi oleh banyak fenomena yang berbeda, seperti warna object,
sumber cahaya, sudut pengambilan gambar, jarak kamera dari object, polusi udara
dsb. Dan sangat sulit untuk menghindari pengaruh tsb terhadap object.
Pada dasarnya, citra 2-D sangat membingungkan karena dari suatu
citra 2-D kita dapat membentuk beberapa gambaran 3-D yang akan meningkatkan
citra tsb.
Pada interpretasi citra tingkat rendah digunakan beberapa hal
1. Pengetahuan
komponen citra tingkat rendah seperti bayangan, texture, warna dan pantulan
cahaya, untuk menentukan gambaran interpretasi yang paling mendekati dari suatu
citra.
2. Menggunakan
lebih dari satu citra untuk object yang sama
yang akan berguna dalam menyusun struktur 3-D.
3. Stereo Vision,
yaitu penggunaan dua atau lebih kamera untuk menghasilkan banyak sudut pandang
yang simultan terhadap suatu object
4. Pengetahuan
tentang bagaimana menbuat efek bergerak pada suatu citra juga akan membantu
interpretasi citra.
Interpretasi Citra Tingkat Tinggi
Dilakukan dengan Ekspektasi Top-Down, yang terdiri dari
langkah-langkah :
1. Mengkonversi
sinyal analog video menjadi citra digital,
proses ini menghasilkan citra yang terdiri dari pixel-pixel
2. Deteksi tepian
dan batas object
tepian dapat dideteksi dengan algoritma yang melihat sekumpulan
pixel yang bernilai sama, batas dapat ditemukan dengan mengelompokkan
pixel-pixel yang sejenis, proses ini akan menghasilkan garis-garis 2-D
3. Orientasi 3-D
akan menghasilkan bentuk-bentuk 2-D dari garis-garis 2-D
4. Pengelompokan
permukaan
akan menghasilkan bentuk-bentuk solid 3-D terpisah
5. Pengelompokan
bentuk
akan menghasilkan object 3-D yang utuh
6. Pencocokan
mencocokkan object 3-D yang didapat dengan basis pengetahuan untuk
mendapatkan interpretasi yang paling mendekati
Contoh Stereo Vision pada mata manusia
Tidak ada komentar:
Posting Komentar