Informações Principais
     Resumo
     Abstract
     Introdução
     Conclusão
     Download
  
  
  
 
Introdução
 
 
Acadêmico(a): Alexandre Busarello
Título: Protótipo para Sumarização Automática de Textos Escritos em Língua Portuguesa
 
Introdução:
Sumarização é uma palavra originada do verbo latino sumere que significa reduzir, diminuir, sintetizar (HEERDT, 1997). Desta forma, é possível dizer que o processo de sumarizar um texto consiste em resumi-lo eliminando o que é irrelevante sem alterar o foco central. No cotidiano as pessoas fazem uso da sumarização muitas vezes sem perceber. Por exemplo, ao narrar um evento a uma pessoa, realiza-se uma síntese do que aconteceu, ao invés de descrever de forma exata o ocorrido (MARTINS et al., 2001, p. 3). Assim sendo, é feita uma sumarização. A sumarização automática é a sintetização de um texto de forma automatizada por programas de computador. Cada pessoa possui uma forma única de organizar as informações relevantes, refletindo assim no sumário manual gerado. O mesmo ocorre com programas de computadores que reproduzem a sumarização automática: programas diferentes geram sumários diferentes.
A sumarização automática é composta de três etapas macro que são: análise, transformação e síntese. Na etapa de análise é feito o processamento de um ou mais textos fontes, gerando como saída a representação interna de todo conteúdo analisado. A etapa de transformação executa o processo de sumarização com base na representação interna gerada pela análise tendo como saída a reprodução interna do sumário. Por fim, a etapa de síntese transforma o conteúdo da reprodução interna do sumário em forma de língua natural (PARDO, 2008, p. 6).
Diante do exposto, propõe-se o desenvolvimento de uma ferramenta para efetuar a sumarização automática de textos, aplicando as etapas descritas anteriormente. A ferramenta tem como saída resumos gerados a partir de textos escritos em língua portuguesa, contendo apenas informações consideradas relevantes. São usados como entrada textos de notícias.