Informações Principais
     Resumo
     Abstract
     Introdução
     Conclusão
     Download
  
  
  
 
Introdução
 
 
Acadêmico(a): Caique Albert Muller Reinhold
Título: MODELO DE UMA REDE NEURAL PROFUNDA PARA RECONHECIMENTO DE TEXTO MANUSCRITO OFFLINE
 
Introdução:
Apesar da era digital oferecer diversos métodos eficazes para se armazenar informação, a escrita manual ainda é utilizada devido à conveniência do papel e caneta (PLAMONDON; SRIHARI, 2000). Entretanto, como mostra Hughes (2004), o armazenamento de informações em meio digital traz diversos benefícios. Segundo ele, alguns dos benefícios são: a maior durabilidade da informação, o menor espaço para armazenamento, agilidade na busca, criação de cópias sem perda de informação, entre outros. Desta forma, o estudo de meios para o reconhecimento de texto manuscrito torna-se atrativo. O reconhecimento de texto manuscrito é a transição para o formato digital de informações manuscritas (VINCIARELLI, 2002). Este se divide em duas áreas, online e off- line, onde na primeira está disponível a trajetória da caneta na superfície e na segunda área estão disponíveis imagens do texto manuscrito. Este assunto vem sendo estudado desde a década de 70 e já possui ferramentas sendo utilizadas em aplicações comerciais (VINCIARELLI, 2002). Entretanto, o desenvolvimento de um sistema confiável e de propósito geral ainda é considerado um problema em aberto (BEZERRA; ZANCHETTIN; ANDRADE, 2012). A complexidade do reconhecimento de texto manuscrito em imagens vem da variação entre os padrões de caracteres, visto que cada pessoa possui um estilo de escrita diferente. Este estilo pessoal pode ainda sofrer alterações devido ao material utilizado para escrita, o estado emocional da pessoa, assim como o espaço e o tempo disponíveis para a escrita (BEZERRA; ZANCHETTIN; ANDRADE, 2012). Outras dificuldades provem da dificuldade em segmentar as linhas de texto devido às variações no espaço entre linhas, linhas de base inconsistentes ou sobreposição de traços de linhas diferentes (ALAEI; PAL; NAGABHUSHAN, 2011). Recentes estudos de neurociência mostram que o neocortex, que é associado a várias habilidades cognitivas, não explicitamente pré-processa os sinais sensoriais. Ele na verdade deixa que se propaguem por uma hierarquia complexa de módulos que ao longo do tempo aprendem a representar observações baseadas nas regularidades que estas apresentam. Esta descoberta foi um dos grandes motivadores da emergência do Aprendizado Profundo (AREL; ROSE; KARNOWSKI, 2010). O Aprendizado Profundo, do inglês Deep Learning, foca em modelos computacionais para representação de informações que exibam comportamentos semelhantes ao do nosso neocortex (AREL; ROSE; KARNOWKI, 2010). Ou seja, modelos que são capazes de aprender a representar informações de alto nível, como classes de objetos, a partir de dados sensoriais, como os pixels de uma imagem. Diante do exposto, este trabalho apresenta um modelo de rede neural profunda para o reconhecimento de texto manuscrito off-line. Além disso, é apresentada a implementação de um protótipo baseado neste modelo para transcrição de imagens de texto manuscrito em texto digital.