TCC - Trabalho de Conclusão de Curso

Informações Principais

Resumo

Abstract

Introdução

Conclusão

Download

Introdução

Acadêmico(a): José Lino Uber

Título: Descoberta de Conhecimento com o Uso de Text Mining Aplicada ao SAC

Introdução:

Em um mundo moderno, o conhecimento tem sido imprescindível para a sobrevivência das empresas. Nas últimas décadas, as empresas estão cada vez mais aumentando suas bases de dados. Vários fatores têm contribuído para este comportamento. A queda nos custos de armazenamento pode ser vista como a principal causa do surgimento dessas enormes bases. Outro fator é a disponibilidade de computadores de alto desempenho a baixo custo.
Tan (1999) afirma que 80% das informações de uma empresa estão em formato textual. Entretanto, as organizações e as pessoas têm dificuldade para tratar adequadamente este tipo de informação por não estar estruturada. A área de Text Mining consiste em duas formas de mineração em textos: a Descoberta de Conhecimento em Textos (DCT) e Descoberta do conhecimento em base de dados (DCBD). A DCT surgiu para minimizar este problema, ajudando a explorar conhecimento armazenado em meios textuais, e pode ser definida como sendo o processo de extrair padrões ou conhecimento, interessantes e não-triviais. A DCBD consiste na mineração em base de dados estruturados que contenham textos.
Por tratar-se de um assunto novo, Nuggest (2001) afirma que Text Mining representa atualmente apenas 4% das técnicas usadas regularmente para mineração de dados, conforme figura 1. A utilização dessa técnica vem aumentando ao passar dos anos, devido a novas pesquisas na área e pela necessidade de resultados rápidos e eficientes no processamento de um grande volume de informação.
Uma forma de realizar a mineração consiste em utilizar a metodologia Cross-Industry Standard Process for Data Mining (CRISP-DM, 2000). Essa metodologia foi criada em 1996 pelo grupo composto pelas empresas DaimlerChrysler, a Statistical Package for the Social Sciences (SPSS) e National Cash Register Company (NCR). É constituída de seis etapas: compreensão do negócio, compreensão dos dados, preparação dos dados, modelagem, avaliação e aplicação.
Os dados estudados neste trabalho são os chamados telefônicos que estão armazenados em uma base de dados. Esses dados são de propriedade da Operacional Têxtil Ltda1 .
Foi desenvolvido um software para minerar os chamados telefônicos. Os chamados telefônicos são compostos por: data de abertura, software utilizado, versão do software, descrição do problema, situação da ficha de atendimento, dentre outros, sendo que a descrição do problema é um texto livre e esta foi a variável analisada. Para isto verificou-se a necessidade da implementação de uma ferramenta para automatizar e auxiliar na análise do elevado número de registros de chamados acumulados, atualmente em torno de 8.000. Pretende-se com isto a identificação do motivo do chamado dos clientes, prevendo situações ou diminuindo novos chamados.
Este trabalho também serve como fonte para novos pesquisadores, já que não existe ou não foi encontrada nenhuma pesquisa em chamados telefônicos de uma software house, portanto torna-se inédito.
Figura 1 – Representação das técnicas utilizadas para Text Mining 1Operacional Têxtil Ltda é uma empresa de desenvolvimento de sistemas para área têxtil.