Informações Principais
     Resumo
     Abstract
     Introdução
     Conclusão
     Download
  
  
  
 
Conclusão
 
 
Acadêmico(a): Fernando Erhardt
Título: Ferramenta para Conversão Texto-Fala da Interface de Aplicações Windows Forms
 
Conclusão:
O trabalho aqui apresentado discorre sobre o desenvolvimento de uma ferramenta de conversão texto-fala das informações textuais de aplicações Windows Forms desenvolvidas para o Microsoft .Net Framework. O estudo dos sistemas de conversão texto-fala possibilitou um melhor entendimento de como estes sistemas devem funcionar e como limitar o escopo da ferramenta desenvolvida. Foi este estudo que possibilitou a delimitação do objetivo inicial, qual seja identificar as aplicações Windows Forms que podem ser interpretadas. Tal objetivo foi atendido, visto que a ferramenta é capaz de identificar todas as aplicações em execução e solicitar ao usuário qual destas aplicações deve ser interpretada. Para que este objetivo fosse atendido, foi utilizada a biblioteca ManagedSpyLib. Sem o estudo desta biblioteca não seria possível a obtenção das informações textuais das aplicações.
Outro objetivo atendido refere-se à obtenção de informações textuais da aplicação que a ferramenta está interpretando. Esta mostrou-se capaz de identificar grande parte dos componentes que formam a interface da aplicação e de obter as informações textuais destes componentes quando da interação do usuário com esta aplicação. Qualquer informação textual obtida pela ferramenta passa por um processamento, para melhorar a legibilidade deste texto. À escolha do usuário, a ferramenta processa estes textos considerando-os como sendo escritos em português ou em inglês.
Para realizar este processamento textual em dois idiomas distintos foi necessário o estudo de alguns pontos da gramática de cada um destes idiomas. O principal ponto trata da forma correta de escrever por extenso os números e as datas em cada idioma, visto que o português e o inglês possuem regras diferentes para este tratamento. Também foi importante o estudo da etapa de processamento textual realizado nos trabalhos correlatos. Este estudo mostrou que tipos de estruturas linguísticas a ferramenta deveria ser capaz de processar.
Um dos objetivos iniciais descritos trata da ferramenta gerar uma saída intermediária em texto, apresentando o resultado do processamento feito no texto original obtido. Durante o desenvolvimento da ferramenta, notou-se que essa não era uma necessidade. Esta funcionalidade da ferramenta seria necessária caso a síntese de áudio tivesse sido desenvolvida na própria ferramenta. Optou-se pela utilização de tecnologias desenvolvidas por terceiros para a síntese da voz. Portanto, optou-se também por não mostrar de forma textual o resultado do processamento de cada texto obtido pela ferramenta. Entretanto, a ferramenta possui uma funcionalidade de testes que permite avaliar a conversão texto-fala de forma independente de outras aplicações. É permitido ao usuário digitar textos e solicitar que o texto digitado seja convertido em áudio. Também é permitido ao usuário que seja visualizado o resultado do processamento deste texto. Ou seja, o usuário pode visualizar o texto final que será passado ao sintetizador de áudio. Assim sendo, o objetivo de mostrar a saída em forma de um texto intermediário pode ser considerado atendido.
O objetivo final da ferramenta, que trata da síntese dos textos obtidos de outras aplicações em tempo real também foi atendido. A ferramenta mostrou-se capaz de sintetizar tanto textos obtidos em português como em inglês, aumentando assim sua utilidade prática, já que grande parte das aplicações são desenvolvidas com uma interface no idioma inglês. O desenvolvimento desta funcionalidade na ferramenta tornou-se possível através da utilização da biblioteca System.Speech. Esta biblioteca foi capaz de prover todos os recursos necessários para a síntese de voz.
A ferramenta apresentou algumas limitações oriundas principalmente de limitações das próprias tecnologias utilizadas. Limitações da própria biblioteca ManagedSpyLib fizeram com que a ferramenta não seja capaz de interpretar corretamente todos os componentes visuais que podem compor uma aplicação Windows Forms desenvolvida para o Microsoft .Net Framework. Entretanto, a quantidade de componentes que a ferramenta é capaz de interpretar é muito superior à quantidade de componentes que não. Desta forma, o resultado obtido da utilização destas interfaces sendo interpretadas pela ferramenta é satisfatório.
A utilização de dicionários expansíveis de siglas, abreviações e pronúncias também se mostrou ser um ponto positivo da ferramenta. Estes dicionários podem ser incrementados pelo próprio usuário, tornando ferramenta cada vez mais abrangente. Entretanto, a principal vantagem da ferramenta desenvolvida está na sua interação com outras aplicações. Este é o principal fator que a diferencia de outros trabalhos semelhantes, permitindo que seja utilizada de forma prática para ler as informações destas aplicações com as quais interage.