Informações Principais
     Resumo
     Abstract
     Introdução
     Conclusão
     Download
  
  
  
 
Introdução
 
 
Acadêmico(a): André Luiz Nunes
Título: PROTÓTIPO DE SISTEMA DE CONSULTAS UTILIZANDO A LINGUAGEM SPARQL
 
Introdução:
A internet foi criada em 1989 por Timothy John Berners Lee, com o objetivo de compartilhar informações através de uma rede mundial de computadores. Atualmente é uma das principais fontes de informações disponível no mundo. Segundo Deters e Adame (2003), os tipos de informação e serviços disponibilizados estão transformando a web cada vez mais em um serviço de informação de cobertura universal.
A internet de hoje é baseada em hyperlinks que interconectam os documentos existentes através da rede. Estas conexões, entretanto, não possuem significado para as máquinas e são apenas apontamentos para outros documentos. Segundo Berners-Lee (2001, p. 1), a internet é baseada em documentos e pode ser chamada web de documentos. Ou seja, sua estrutura depende de arquivos formatados que serão lidos por um browser e apresentados para o usuário, porém as máquinas são incapazes de compreender estes documentos. Apesar dos benefícios indiscutíveis que o modelo atual da internet oferece, os mesmos princípios que permitiram que a web de documentos florescesse não foram aplicados à web de dados (BIZER et al., 2009, p. 1).
Tradicionalmente, os dados publicados na web são disponibilizados através de dumps brutos em formatos como Comma Separated Values (CSV), Extensible Markup Language (XML) ou como tabelas no formato HyperText Markup Language (HTML), sacrificando grande parte de sua estrutura e semântica (BIZER et al. 2009, p.1 ). Segundo Deters e Adame (2003), o crescimento exponencial da web, sua diversidade de informações e a sua estruturação caótica, faz com que encontrar informações relevantes seja frequentemente uma tarefa demorada, difícil e para muitos usuários uma atividade frustrante.
Sabe-se que nas páginas web há um incontável conjunto de dados estruturados contendo todo o tipo de informação. Esses dados são propriedade de empresas, que optam por deixá-los acessíveis. Tipicamente um conjunto de dados contém conhecimento sobre um domínio em particular como livros, música, dados enciclopédicos, empresas. Quando estes conjuntos de dados forem interligados (tenham links como websites), uma máquina poderia atravessar esta web independente de dados estruturados para ganhar conhecimento semântico sobre entidades e domínios. Este formato de organização dos dados na rede é chamado de web semântica. Já a definição dos termos utilizados na descrição e na representação de uma área de conhecimento é denominada de ontologia (W3C OWL WORKING GROUP, 2009). Segundo Gruber (1993), uma ontologia é uma especificação explícita de uma conceituação, que são entidades existentes em alguma área de interesse e suas relações. Ou seja, a conceituação é uma visão abstrata e simplificada do mundo que se deseja representar, onde o que existe é exatamente o que pode ser representado.
Sendo assim, com a web semântica será possível obter dados, definir vocabulários, definir ontologias e consultar dados. Isso é possível com a utilização das linguagens Resource Description Framework (RDF), Web Ontology Language (OWL), Linked Data e Simple Protocol And RDF Query Language (SPARQL), respectivamente (W3C BRASIL, 2011). SPARQL é o padrão adotado pelo W3C para localização de informações na infraestrutura da web semântica. Sua estrutura lembra o formato de uma query SQL, porém SPARQL é otimizado para trabalhar com a estrutura de triplas do RDF.
Desta forma, o trabalho proposto pretende demonstrar o funcionamento da web semântica na prática. Para isto foi desenvolvido um protótipo para submissão de querys SPARQL que trabalharão com informações reais já disponíveis em grandes ontologias na internet.