Visi komputer ataupenglihatan komputer adalahbidang ilmiah antardisiplin yang membahas bagaimana komputer dapat memperoleh pemahaman tingkat tinggi darigambar atauvideodigital. Dari perspektifteknik, bidang ini berupaya mengotomatiskan tugas-tugas yang dapat dilakukan olehsistem penglihatan manusia.[1][2][3]
Tugas visi komputer meliputi metode untukmemperoleh,memproses,menganalisis dan memahami gambar digital, dan ekstraksi datadimensi tinggi dari dunia nyata untuk menghasilkan informasi numerik atau simbolis,misalnya, dalam bentuk keputusan.[4][5][6][7] Pengertian dalam konteks ini berarti transformasi gambar visual (input retina) menjadi deskripsi mengenai dunia sekitar yang dapat berinteraksi dengan proses pemikiran lain dan memperoleh tindakan yang sesuai. Pemahaman gambar ini dapat dilihat sebagai penguraian informasi simbolik dari data gambar menggunakan model yang dibangun dengan bantuan geometri, fisika, statistik, dan teori pembelajaran.[8]
Sub-domain dari visi komputer meliputirekonstruksi adegan, deteksi peristiwa,pelacakan video, pengenalan objek,estimasi pose 3D, pembelajaran, pengindeksan,estimasi gerakan, danpemulihan gambar.[6]
Visi komputer adalahbidang antardisiplin yang membahas bagaimana komputer dapat direkayasa untuk mendapatkan pemahaman tingkat tinggi dari masukan data berupagambar atauvideodigital. Dari perspektifteknik, bidang ini berupaya mengotomasikan tugas-tugas yang dapat dilakukan olehsistem penglihatan manusia.[1][2][3] "Visi komputer berkaitan dengan ekstraksi otomatis, analisis, dan pemahaman informasi yang berguna dari satu gambar atau urutan gambar. Ini melibatkan pengembangan dasar teoretis dan algoritmik untuk mencapai pemahaman visual otomatis".[9] Sebagaidisiplin ilmu, visi komputer berkaitan dengan teori di balik sistem buatan yang mengekstraksi informasi dari gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa kamera, atau data multidimensi daripemindai medis.[10]
Pada akhir 1960-an, visi komputer dimulai di universitas yang merintiskecerdasan buatan. Teknologi ini dimaksudkan untuk menirusistem penglihatan manusia, sebagai batu loncatan untuk memberkahi robot dengan perilaku cerdas.[11] Pada tahun 1966, diyakini bahwa ini dapat dicapai melalui proyek musim panas, dengan menempelkan kamera ke komputer dan membuatnya "menggambarkan apa yang dilihatnya".[12][13]
Apa yang membedakan visi komputer dari bidangpengolahan gambar digital yang lazim pada waktu itu adalah keinginan untuk mengekstraksi strukturtiga dimensi dari gambar dengan tujuan mencapai pemahaman adegan penuh. Studi pada tahun 1970-an membentuk fondasi awal untuk banyakalgoritma visi komputer yang ada saat ini, termasukekstraksi tepi dari gambar, pelabelan garis,pemodelan non-polihedral danpolihedral, representasi objek sebagai interkoneksi dari struktur yang lebih kecil,aliran optik, danestimasi gerak.[11]
Dekade berikutnya ditandai dengan studi berdasarkananalisis matematika yang lebih ketat dan aspek kuantitatif dari visi komputer. Ini termasuk konsep matematikaskala-ruang, inferensi bentuk dari berbagai isyarat sepertibayangan, tekstur dan fokus, sertamodel kontur yang dikenal sebagaisnake. Para peneliti juga menyadari bahwa banyak dari konsep-konsep matematika ini dapat diperlakukan dalam kerangka optimisasi yang sama sepertiregularisasi danbidang acak Markov.[14]
Pada 1990-an, beberapa topik penelitian sebelumnya menjadi lebih aktif daripada yang lain. Penelitian dalamrekonstruksi 3Dproyektif menyebabkan pemahaman yang lebih baik mengenaikalibrasi kamera. Dengan munculnya metode optimasi untuk kalibrasi kamera, disadari bahwa banyak ide yang telah dieksplorasi dalam teoripenyesuaian bundel dari bidangfotogrametri. Ini mengarah pada metoderekonstruksi 3-D dari beberapa gambar. Kemajuan dibuat dalam masalah korespondensistereo padat dan teknik stereo multipandang yang lebih maju. Pada saat yang sama,variasi potongan grafik digunakan untuk menyelesaikansegmentasi gambar. Dekade ini juga menandai pertama kalinya teknik pembelajaran statistik digunakan dalam praktik untuk mengenali wajah dalam gambar (lihatEigenface). Menjelang akhir 1990-an, perubahan signifikan terjadi dengan meningkatnya interaksi antara bidanggrafis komputer dengan visi komputer. Ini termasuk rendering berbasisgambar,perubahan gambar, interpolasi tampilan,jahitan gambar panorama danrendering bidang cahaya awal.[11]
Perkembangan terkini ditandai dengan kebangkitan metode berbasisfitur, digunakan bersama dengan teknik pembelajaran mesin dan kerangka kerja optimasi yang kompleks.[15][16]