Informações Principais
     Resumo
     Abstract
     Introdução
     Conclusão
     Download
  
  
  
 
Introdução
 
 
Acadêmico(a): Alexandre Daniel Dalabrida
Título: Protótipo de um Sistema de Extração de Regras Simbólicas de Redes Neurais Artificiais Utilizadas na Tarefa de Classificação em Data Mining
 
Introdução:
No decorrer dos últimos anos, a capacidade de gerar e coletar dados tem crescido rapidamente. A informatização cada vez mais maciça e os avanços no armazenamento e coleta de dados têm provido uma imensa quantidade de dados e tal volume tem claramente ultrapassado a habilidade humana de interpretar os mesmos. Tornou-se óbvia a necessidade urgente de novas técnicas ou ferramentas que possam, de forma inteligente e automática, transformar os dados processados em informação útil e conhecimento. Essas técnicas e ferramentas são assunto do campo da descoberta de conhecimento em bancos de dados, ou Knowledge Discovery in Databases (KDD) (FAYYAD et al., 1996, p. 2). Por descoberta de conhecimento em bases de dados entende-se encontrar regularidades e informações interessantes de alto nível, que são extraídas de um conjunto relevante de dados e investigadas de diferentes ângulos. O conhecimento descoberto pode ser aplicado a sistemas de informação, processamento de consultas, como suporte à tomada de decisões, controle de processos e muitas outras aplicações (CHEN, HAN e YOU, 1996, p. 866). Nesse contexto, a data mining apresenta-se como uma classe de métodos e técnicas que são usadas em algumas das etapas do processo de KDD (FAYYAD et al., 1996, p. 3). Conforme Chen, Han e You (1996, p. 875), pesquisas são feitas em muitos campos da área da computação, como sistemas gerenciadores de bancos de dados, aprendizado de máquina, estatística, aquisição de conhecimento, e fornecem para a data mining as mais variadas ferramentas e técnicas para a execução das suas tarefas. Uma das tarefas de data mining é a tarefa de classificação de dados em um grande conjunto de dados. Segundo Chen, Han e You (1996, p. 875), a classificação de dados é o processo ou a tarefa que procura propriedades comuns entre um conjunto de objetos em uma base de dados e então classifica estes objetos em diferentes classes pré-definidas, de acordo com um modelo ou regras de classificação. Aplicações da classificação incluem, por exemplo, diagnósticos médicos, predição de desempenho e seleção de mercado. A classificação de dados utiliza como ferramentas artefatos das áreas de estatística, aprendizado de máquina, redes neurais e sistemas especialistas (KULIKOWSKI e WEISS, 1991, p. 271). Vários algoritmos de classificação resultantes desses estudos foram então desenvolvidos. Segundo Kecman (2001, p. 35), as redes neurais artificiais representam uma família de modelos que tem sido utilizada em uma ampla variedade de problemas de classificação em data mining, onde as seguintes vantagens estão presentes: a) alto rendimento da generalização perante os exemplos não vistos durante a fase de aprendizado; b) robustez na presença de imprecisão ou ruído nos dados de entrada; c) habilidade para aprender relações não lineares, a qual é uma característica importante para manipular bases de dados reais. Uma das limitações, porém, nos modelos neurais artificiais, é que o conhecimento derivado do processo de aprendizagem encontra-se sintetizado em uma forma não simbólica (matrizes de pesos), o que torna difícil sua interpretação. Para superar essa limitação das redes neurais em relação a sua falta de transparência, a hipótese gerada por estes modelos pode traduzir-se a uma forma interpretável. Os métodos que realizam essa transformação são conhecidos como algoritmos de extração de regras (SETIONO; LEOW; ZURADA, 2002, p. 564). Conforme Berthold e Hand (1999, p. 53), ainda que o requisito de uma solução compreensível dependa das necessidades da aplicação e dos usuários finais do sistema, as vantagens que se obtêm com estas transformações são: a) provisão da capacidade de explicação, a qual resultará em um melhor entendimento do problema e da sua solução; b) exploração de dados, ao revelar os relacionamentos entre as variáveis de sistema que foram descobertas durante a aprendizagem e que se encontram codificadas em um formato incompreensível. Segundo Andrews, Diederich e Tickle (1995, p. 373), o conhecimento capturado por uma rede neural durante sua aprendizagem está representado em termos da topologia da rede, das funções de ativação utilizadas pelos neurônios e pelos parâmetros associados com as conexões (pesos). As técnicas de extração devem então interpretar estes elementos e a partir dos mesmos gerar uma descrição mais compreensível que seja funcionalmente equivalente à rede neural. Conforme Andrews, Diederich e Tickle (1995, p. 380), os tipos de técnicas de extração de regras podem ser subdividas em: decomposicional, pedagógica e eclética. A técnica decomposicional procura extrair as regras no nível das unidades individuais da rede neural (neurônios intermediários e de saída), tendo uma visão interna e transparente da rede. Já a abordagem pedagógica não explora o interior da rede neural, considerando então a extração de regras das redes neurais como uma tarefa de aprendizado, onde o conceito alvo é a função computada pela rede e as características das entradas são simplesmente as entradas da rede neural. Assim, as técnicas pedagógicas auxiliam a extrair regras que mapeiam entradas diretamente em saídas e a motivação é usar a rede neural para gerar exemplos para um algoritmo de aprendizado simbólico. A abordagem eclética utiliza-se das características das duas abordagens, utilizando o conhecimento sobre a arquitetura interna da rede treinada (abordagem decomposicional) para complementar um algoritmo de aprendizado simbólico. De acordo com Azevedo, Brasil e Oliveira (2000, p. 197), as técnicas de extração de regras procuram esclarecer ao usuário como a rede chegou a uma decisão, decodificando o(s) estado(s) interno(s) da rede. A maioria dos esforços tem sido direcionada no sentido de apresentar as explanações como um conjunto de regras expressas como lógica simbólica convencional, isto é, valores booleanos, na forma se...então...senão...., o que torna as regras bem compreensíveis do ponto de vista humano. A aplicação de algoritmos de extração de regras de redes neurais artificiais ajuda a realizar uma aprendizagem a partir de exemplos representativos do problema, passando estas regras a formar parte da base de conhecimento. Além do mais, as regras extraídas podem ser usadas para validar a acurácia da rede ou refinar regras simbólicas já existentes para um determinado problema. Reconhecendo então a capacidade das redes neurais na tarefa de classificação de dados em data mining e visto que é possível a explanação do conhecimento adquirido pelas mesmas através das técnicas de extração de regras, propõem-se especificar e desenvolver um protótipo de uma ferramenta de software que permita construir e treinar redes neurais artificiais na tarefa de classificação em data mining e então aplicar algoritmos de extração de regras sobre estas redes. A ferramenta deverá então exibir as regras extraídas e permitir avaliar as mesmas em relação à acurácia, ou seja, a taxa de acerto de classificação das mesmas, e também indicar a complexidade das regras extraídas. Os algoritmos de extração de regras a serem aplicados serão o RX (também conhecido como NEURORULE), de abordagem decomposicional e o TREPAN, da abordagem pedagógica. Como estudos de caso para demonstrar a funcionalidade da ferramenta, serão utilizados conjuntos de dados de domínio público, que representam problemas específicos para a tarefa de classificação de dados em data mining. O trabalho justifica-se pela necessidade de desenvolvimento e aprimoramento de tecnologias computacionais que permitam a provisão da capacidade de explanação em sistemas que utilizam técnicas baseadas em inteligência artificial, mais especificamente de redes neurais artificiais, cuja natureza conexionista torna difícil a interpretação das conclusões obtidas pela rede. A necessidade de explanação torna-se mais óbvia em sistemas de data mining que utilizam redes neurais como modelos de classificação, onde a eficácia do modelo proposto pode ser aferida com base nas explanações providas pela regras extraídas, além de oferecer respaldo e segurança nas tomadas de decisões baseadas nas informações do modelo já em uso.