Informações Principais
     Resumo
     Abstract
     Introdução
     Conclusão
     Download
  
  
  
 
Conclusão
 
 
Acadêmico(a): Thiago Minhaqui Oechsler
Título: Processamento de Texto Escrito em Linguagem Natural para um Sistema Conversor Texto-Fala
 
Conclusão:
Apesar de ser alvo de estudos há quase 20 anos, as tecnologias referentes à linguagem natural computacional só se tornaram parte presente do cotidiano em aplicações que se limitam quase sempre a atender um objetivo bem específico dentro de um universo definido. Isto se deve a constante complexidade de efetuar o processamento de linguagem natural. A exemplo disso, pode-se citar aplicações como os aparelhos celulares com reconhecimento de marcas vocais, os sistemas automatizados de tele-atendimento e até mesmo carros com sistemas incorporados para leitura de mensagens SMS. Neste trabalho foi analisada a questão do processamento lingüístico. Também foram usados conceitos de orientação a objetos para implementação de quatro etapas do processo de conversão texto-fala (pré-processamento, análise linguística, transcrição fonética, processamento prosódico). Inicialmente foi proposto que o protótipo deveria processar adequadamente textos escritos em português de um vocabulário restrito. O protótipo implementado supera este objetivo, pois não impõe restrições ao vocabulário processado. Também foi definido que o processamento linguístico efetuado pelo protótipo deveria comportar regras gramaticais da língua portuguesa, incluindo o novo acordo ortográfico. Verifica-se que o protótipo implementa várias normas gramaticais (incluindo uma verificação sintática) e também as regras do novo acordo ortográfico. Ao final do processo é gerado um arquivo com a transcrição completa, que inclusive incorpora um sintetizador para verificação do resultado. Todo o processamento linguístico é realizado em um pacote (biblioteca), que pode ser incorporado a qualquer outro projeto desenvolvido em Delphi. Com isso, conclui-se que todos os objetivos foram alcançados, embora com limitações. A maior dificuldade dentro de todo o trabalho foi pesquisar as regras gramaticais que norteiam a estrutura fonética do idioma nacional. Em muitos casos simplesmente não existe norma e nem regra para definir a pronúncia da palavra. As gramáticas justificam a pronúncia baseada nos hábitos fonéticos da população ou na sua palavra de origem (normalmente do latim ou do grego). Desta forma, foi necessário um levantamento bibliográfico muito mais demorado do que o esperado. Muitas das regras definidas e implementadas foram arbitrariamente geradas a partir de uma análise feita em cima de amostras do vocabulário. Por isso, mesmo sendo alvo de estudos a quase 20 anos, um sistema texto-fala sempre será um desafio, pois existem muitas particularidades fonéticas não-metódicas, que impedem o avanço de um sistema sintetizador livre de uma base de dados ou dicionário de exceções. O sintetizador MBROLA, aliado ao GALS, foi de altíssima importância para o desenvolvimento deste protótipo. As duas ferramentas nortearam todo o desenvolvimento. O GALS através da geração dos analisadores léxico e sintático, reduziu em muito o trabalho para pré-processamento do texto de entrada, e o sintetizador MBROLA orientou precisamente como seria o arquivo de saída, possibilitando validar a sua qualidade fonética. O ambiente de programação Delphi mostrou-se adequado para tratamento de cadeias de caracteres, sendo que os componentes nativos foram suficientes para todas as necessidades de construção do protótipo. Espera-se que o protótipo desenvolvido possa contribuir no desenvolvimento de uma ferramenta completa de text-to-speech, que possivelmente possa ser incorporada ao site de instituições de ensino e dê a possibilidade para pessoas com deficiência visual acessar o conteúdo destas instituições. Adicionalmente, o protótipo ainda possui muitas limitações no que diz respeito ao texto de entrada. Sabe-se que os textos de internet não são perfeitamente elaborados ou diagramados, havendo erros ortográficos, sintáticos e semânticos diversos, além do uso de palavras estrangeiras. O texto de entrada para o protótipo deve estar em perfeita conformidade com a gramática da língua portuguesa e com a gramática especificada no GALS, sob o risco de gerar erros que impeçam o funcionamento do programa. Outra limitação é com relação a nomes próprios. Muitas vezes estas palavras apresentam sequências inválidas de letras se comparado com as normas da língua portuguesa. O nome do autor deste trabalho, por exemplo, apresenta um encontro consonantal impróprio para o idioma nacional (th). Estes tipos de palavras podem gerar erros durante o processamento linguístico ou durante a síntese e não permitem que o protótipo funcione adequadamente. Pode-se salientar também a limitação do protótipo para gerar transcrições diferentes de uma mesma palavra, conforme explicado na seção 3.3.3. Esta característica negativa (oriunda da estratégia utilizada na análise linguística) pode prejudicar em alguns casos a compreensão imediata da síntese do texto. Apesar destas limitações, o protótipo implementado teve um desempenho que surpreendeu as 15 das pessoas a qual ele foi apresentado. Algumas destas pessoas chegaram a solicitar cópias do programa, mesmo em estado incompleto, para usarem como um leitor autônomo de documentos. Em um dos testes realizados, foi escrita uma mensagem completa utilizando o protótipo e enviado por e-mail o arquivo de som (com duração aproximada de 5 minutos) ao destinatário, sem legendas e sem indicação de tema. O destinatário compreendeu 100% da mensagem e respondeu o e-mail dentro do tema abordado, inclusive, respondendo os questionamentos feitos, o que indica que o processamento prosódico mostrou-se perceptível. Por fim, pode-se dizer que uma das vantagens mais importantes do protótipo também é a capacidade de tratar o novo acordo ortográfico, que entrou em vigor neste ano de 2009.