Informações Principais
     Resumo
     Abstract
     Introdução
     Conclusão
     Download
  
  
  
 
Introdução
 
 
Acadêmico(a): Ricardo Iuri Salvador
Título: BIBLIOTECA PARA ANÁLISE DE DADOS EM IMAGENS ESTEREOSCÓPICAS
 
Introdução:
A visão faz parte do sistema nervoso central e é ela que permite que organismos processem detalhes visuais (VISUAL, 2013). A visão realiza diversas tarefas, desde a recepção da luz e a formação de imagens monoculares, até a construção de uma visão binocular através de um par de duas projeções dimensionais.
Para facilitar o entendimento das limitações da visão monocular basta fechar um dos olhos e tentar realizar tarefas do cotidiano. O simples gesto de pegar um copo sobre a mesa passará a ser um desafio com apenas um dos olhos abertos. A dificuldade mais evidente, neste caso, é a de perceber a profundidade e avaliar a distância que separa o objeto do observador.
A visão monocular conta com elementos para uma percepção rudimentar da profundidade, valendo-se apenas das leis da perspectiva, onde o tamanho aparente dos objetos diminui à medida que esses se afastam do observador. Assim, os objetos mais próximos acabam escondendo, atrás de si, os objetos mais distantes que se encontram sobre o mesmo eixo de perspectiva (MOMM, 2001).
A visão humana é binocular e adquire a informação a partir de dois olhos que recebem a luz de dois pontos de vista diferentes e com isso conseguem gerar uma imagem estereoscópica. Estereoscopia é um termo utilizado para definir a ilusão de profundidade, fazendo o uso da visão binocular (STEREOSCOPY, 2013).
Ao assistir uma televisão, nota-se que a imagem ali, independente da resolução, é projetada em duas dimensões. Portanto, ao convergir os olhos para que estes foquem na tela da televisão, a imagem é exibida naquela distância. Desta maneira, não existe percepção de profundidade, pois a imagem está sendo exibida em um plano.
Para se exibir uma imagem estereoscópica numa televisão, em vez de gravar apenas uma imagem, deve-se realizar a captura de duas e exibi-las individualmente para que o olho esquerdo veja apenas a imagem esquerda, e o olho direito apenas a direita. Desta maneira pode-se simular a sensação de profundidade com duas imagens planas.
O método mais comum para capturar uma imagem estereoscópica é usar duas câmeras com as lentes em paralelo e com uma certa distância horizontal entre elas e assim simular o comportamento/distância dos olhos humanos.
Esta tecnologia encontra-se presente no dia a dia cada vez mais, como filmes sendo gravados com auxílio de duas câmeras, televisões/projetores/monitores que exibem imagens estereoscópicas, celulares/câmeras que capturam imagens tridimensionais. Em razão disso deve-se facilitar a existência de técnicas e ferramentas para trabalhar com estas imagens. Ou seja, algoritmos que antes funcionavam com apenas uma câmera podem agora ser implementados para funcionar com duas câmeras paralelas, recebendo então o dobro de informação. Desta maneira, a aquisição de informações do mundo real pode ser mais completa.
Visão computacional é uma área da computação cujo propósito é possibilitar a um computador entender um ambiente através das informações visuais disponíveis (SHIRAI, 1987, p. 1). Esta área estuda a aquisição e assimilação de informações extraídas de imagens, transformando-as em dados que podem ser mensurados.
Algumas das técnicas de visão computacional atualmente utilizadas são ainda muito precárias, pois alguns tipos de reconhecimentos não podem ser feitos a partir de uma simples imagem 2D , especialmente quando o objetivo é obter medidas de profundidade ou reconhecer imagens que devido à iluminação não controlada acabam perdendo a definição e não podem ser reconhecidas pelos algoritmos. Uma das maneiras de tentar minimizar este problema é com a aquisição de mais pontos de vista, ou seja, câmeras de ângulos diferentes. Quanto mais câmeras, maior a quantidade de informações que pode ser obtida. Por isso, a estereoscopia é uma grande aliada da área de visão computacional.
Diante do exposto, o objetivo deste trabalho é desenvolver uma biblioteca que vai fornecer diversos algoritmos já conhecidos na área de visão computacional também para imagens estereoscópicas. Desta forma, alguns dos algoritmos de visão computacional que podem se beneficiar com a adição de uma câmera são estudados e utilizados nesta biblioteca, que por sua vez está disponibilizada para outros desenvolvedores que pretendem trabalhar com imagens estereoscópicas.