Informações Principais
     Resumo
     Abstract
     Introdução
     Conclusão
     Download
  
  
  
 
Introdução
 
 
Acadêmico(a): Thiago Minhaqui Oechsler
Título: Processamento de Texto Escrito em Linguagem Natural para um Sistema Conversor Texto-Fala
 
Introdução:
No filme 2001 Uma Odisseia no Espaço, o computador central da espaçonave, nomeado HAL, fala com os tripulantes da nave, obedecendo a ordens e dando instruções. O filme de 1968 já tratava da possibilidade de um computador emitir sons em forma de fala e comunicar-se na língua do seu operador. Esta facilidade na operação de um computador representada no filme é, nos dias de hoje, tema de estudos e de investimentos na procura por facilitar a interação entre usuário e computador. Para operar um computador comum atualmente é necessário que a pessoa seja alfabetizada, saiba usar mouse e teclado, e, principalmente, não tenha deficiência visual severa (não seja cego). Estas condições se tornam ainda mais essenciais quando evidencia-se o uso da escrita como veículo de troca de informação entre homem-máquina. Por sua vez, desde o lançamento do filme até hoje, a computação já apresenta algumas soluções para estas necessidades, como por exemplo, sistemas de conversão texto-fala (Text-to-speech) ou síntese da fala. Este tipo de software, difundido principalmente na língua inglesa, pode auxiliar pessoas com deficiência visual, e até mesmo analfabetos, a usarem um computador. Alguns destes sistemas já podem ser encontrados gratuitamente na internet, inclusive para o sistema operacional Windows. Porém, na língua portuguesa, em comparação à língua inglesa, não existem muitos sistemas de conversão texto-fala, o que evidencia uma necessidade importante de estudar esta questão. Com um sistema como este, é possível que uma pessoa que não saiba ler e escrever possa apontar o cursor do mouse sobre um texto em uma página de internet e ouvir o conteúdo da mesma. Da mesma forma, um deficiente visual poderia utilizar as setas de navegação do teclado, para que o sistema percorresse os textos da página, sintetizando-os em voz. Estes dois exemplos demonstram o quanto um sistema conversão texto-fala pode contribuir para massificação da informática e a inclusão digital. Diante do exposto, neste trabalho é proposto o desenvolvimento de um sistema para conversão texto-fala a partir do processamento de texto escrito em linguagem natural. Segundo Simões (1999, p. 13), “pode se definir um sistema de síntese de fala como sendo um sistema capaz de produzir sinais de fala de maneira artificial”. A síntese de voz normalmente é composta de um conjunto de etapas que envolvem desde a identificação do contexto a ser sintetizado até a geração das ondas da fala. Uma etapa intermediária é a conversão do texto para unidades linguísticas equivalentes aos sons da linguagem. O problema é que esta relação não é direta e varia de um idioma para outro, exigindo assim que sejam implementadas regras para que o sistema de síntese possa efetuar essa etapa do processo (FRANZEN, 2002, p. 13). De forma geral, as etapas do processo de conversão texto-fala são: pré-processamento, análise linguística, transcrição fonética, processamento prosódico e síntese. Com exceção da última etapa (síntese), as primeiras dedicam-se a realizar o processamento das palavras. As estratégias usadas na implementação destas etapas têm impacto direto no desempenho final do sistema e podem comprometer o resultado desejado – uma fala inteligível e natural. Isso denota a importância destas quatro primeiras etapas e é exatamente o que é investigado neste trabalho, ficando excluída a etapa de processamento acústico (síntese), em que de fato é realizada a síntese da fala.