Informações Principais
     Resumo
     Abstract
     Introdução
     Conclusão
     Download
  
  
  
 
Introdução
 
 
Acadêmico(a): Samuel Lucas Fink
Título: Indução de Árvores de Decisão Difusas
 
Introdução:
Com os avanços tecnológicos de coleta e armazenamento de dados, os Sistemas de Informações (SI) das organizações acumulam diariamente um grande volume de dados em seus bancos de dados. No entanto, para algumas aplicações, muito destes dados armazenados não têm significado nenhum quando analisados isoladamente e sem nenhuma interpretação (CARVALHO, 2003, p. 10). Desta forma, com o passar do tempo, observou-se que é possível transformar os dados armazenados em conhecimento, a fim de auxiliar na tomada de decisão de processos gerenciais da organização.
Para a transformação dos dados armazenados em informações úteis, é necessário técnicas e ferramentas. Para isto, pode ser utilizado o processo denominado Descoberta de Conhecimento em Bases de Dados, ou em inglês Knowledge Discovery in Database (KDD) que, para Tan, Steinbach e Kumar (2009, p. 4), é o processo geral de conversão de dados brutos em informações úteis.
O KDD é composto por várias etapas, entre elas a Mineração de Dados, ou em inglês Data Mining (DM). Segundo Carvalho L. (2005, p. 3), DM compreende o uso de técnicas automáticas de exploração de grandes quantidades de dados de forma a descobrir novos padrões e relações que, devido ao volume de dados, não são facilmente descobertas a olho nu pelo ser humano. Para o desenvolvimento de DM, podem ser utilizadas técnicas como estatística, redes neurais artificiais e inteligência artificial simbolista (CARVALHO, L., 2005, p. 19).
Na utilização da inteligência artificial simbolista encontram-se a árvore de decisão que segundo Barbieri (2001, p. 170) é utilizada de forma satisfatória na tarefa de DM. Porém, ao lidar com atributos contínuos , as árvores de decisão são sensíveis a ruídos e instabilidades nos dados analisados (PENG; FLACH, 2001, p. 109). Como proposta, Peng e Flach (2001, p. 110) sugeriram a utilização de conjuntos difusos para tratar os atributos contínuos.
Resumidamente este trabalho apresenta o desenvolvimento de uma biblioteca para a indução de árvore de decisão difusa que utiliza o algoritmo C4.5 (QUINLAN, 1993), juntamente com lógica difusa, a fim de lidar com os ruídos e instabilidades dos atributos contínuos.
O objetivo é utilizar a representação dos conjuntos difusos com a técnica de árvores de decisões, para obter vantagens como tratamento de incertezas, processamento gradual com compreensão, popularidade e facilidade de aplicação, a fim de melhorar a qualidade do conhecimento obtido no processo de KDD.