IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

La FAQ sur le Web sémantiqueConsultez toutes les FAQ

Nombre d'auteurs : 6, nombre de questions : 48, dernière mise à jour : 16 juin 2013 

 
OuvrirSommaireProvenance
précédentsommaire
 
 

Le web sémantique et ses technologies favorisent l'interconnexion de nombreuses sources de données. Parmi ces sources de données ouvertes, toutes n'auront pas la même fiabilité selon les utilisations/utilisateurs. Dans ce contexte, il est important de pouvoir retracer la provenance des différentes données que nous utilisons, afin de pouvoir leur attribuer des niveaux de fiabilité et de complétude. Ainsi, différentes solutions sont utilisées, les graphes nommés et plus récemment le modèle PROV.

Pour illustrer avec un exemple, imaginons un graphe RDF représentant des données sur les différentes villes de France fourni par un site gouvernemental officiel. Ensuite imaginons des données du même ordre fournies par une association régionale visant à mettre en lumière les villes de sa région. Nous pourrions vouloir utiliser les deux sources de données car une association régionale pourrait avoir des informations plus précises et sur un plus grand nombre de villes (y compris les petites dont le site national ne tient pas compte). Cependant il pourrait être utile lors de l'utilisation de ces différentes données, de pouvoir identifier qui les a produite, nous n'accorderont sûrement pas la même crédibilité à une association régionale qu'à un site officiel national (sans que leurs données en soient pour autant inintéressantes).

Ce cas de figure se retrouve dans beaucoup de domaines lorsqu'on est confronté à l'open data, que ce soit des données officielles d'un organisme scientifique couplées à celles de laboratoire locaux plus petits ou celles de l'exemple précédent.

Créé le 2013-06-16  par Pandapi

Lien : HttpRange-14
Lien : PROV Primer

Les graphes nommés viennent de l'idée d'intégrer plusieurs graphes RDF dans une seule source de données. Le but est de répondre à des besoins d'identification des données en fonction d'un contexte (la provenance), c'est donc une façon d'intégrer une métadonnée sur les triplets. Pour ce faire, on attribut un graphe identifié par une URI aux différentes sources de données utilisées. On a ainsi un graphe d'ensemble représentant la globalité de nos ressources, découpé en sous-graphes selon la provenance des données.

Créé le 2013-06-16  par Pandapi

Lien : Graphe nommés

Un quadruplet est le format utilisé lorsqu'on souhaite représenter un triplet RDF accompagné de son contexte. Ainsi on ajoute le contexte au triplet classique sujet-prédicat-objet, obtenant ainsi sujet-prédicat-objet-contexte. On en trouve un exemple sur chaque ligne d'un fichier au format N-Quads.

Créé le 2013-06-16  par Pandapi

Lien : Graphe nommés

Il existe plusieurs formats de fichier possibles pour l'utilisation de quadruplets dont voici les principaux :

  • TriX qui signifie Triples in XML, est comme son nom l'indique un format utilisant le langage XML. L'extension des fichiers est ".trix", un exemple issue de wikipédia pour cette syntaxe :
 
Sélectionnez
<TriX>
<graph>
  <triple>
    <uri>http://example.org/Bob</uri>
    <uri>http://example.org/wife</uri>
    <uri>http://example.org/Mary</uri>
  </triple>
  <triple>
    <uri>http://example.org/Bob</uri>
    <uri>http://example.org/name</uri>
    <plainLiteral>Bob</plainLiteral>
  </triple>
  <triple>
    <uri>http://example.org/Mary</uri>
    <uri>http://example.org/age</uri>
    <typedLiteral datatype="http://www.w3.org/2001/XMLSchema#integer">32</typedLiteral>
  </triple>
</graph>
</TriX>
  • TriG est une extension du format Turtle qui est, lui, utilisé pour les triplets. Il permet de concaténer différents fichiers Turtle grâce à des graphes nommés. L'extension des fichiers TriG est ".trig". Un exemple issue du site du W3C pour cette syntaxe :
 
Sélectionnez
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix swp: <http://www.w3.org/2004/03/trix/swp-1/> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix ex: <http://www.example.org/vocabulary#> .
@prefix : <http://www.example.org/exampleDocument#> .
 
:G1 { :Monica ex:name "Monica Murphy" .      
      :Monica ex:homepage <http://www.monicamurphy.org> .
      :Monica ex:email <mailto:monica@monicamurphy.org> .
      :Monica ex:hasSkill ex:Management }
 
:G2 { :Monica rdf:type ex:Person .
      :Monica ex:hasSkill ex:Programming }
 
:G3 { :G1 swp:assertedBy _:w1 .
      _:w1 swp:authority :Chris .
      _:w1 dc:date "2003-10-02"^^xsd:date .   
      :G2 swp:quotedBy _:w2 .
      :G3 swp:assertedBy _:w2 .
      _:w2 dc:date "2003-09-03"^^xsd:date .
      _:w2 swp:authority :Chris .
      :Chris rdf:type ex:Person .
      :Chris ex:email <mailto:chris@bizer.de> }
  • N-Quads est un format "complet" dont l'extension est ".nq". Chacune des lignes contient un quadruplet sujet-prédicat-objet-contexte. Un exemple issue du site du W3C pour cette syntaxe :
 
Sélectionnez
<http://one.example/subject1> <http://one.example/predicate1> <http://one.example/object1> <http://example.org/graph3> .
_:subject1 <http://an.example/predicate1> "object1" <http://example.org/graph1> .
_:subject2 <http://an.example/predicate2> "object2" <http://example.org/graph5> .
Créé le 2013-06-16  par Pandapi

Lien : TriG
Lien : N-Quads
Lien : Graphe nommés

Il existe une syntaxe particulière de SPARQL permettant d'effectuer des requêtes sur des bases de quadruplets. La forme générale de ces requêtes sera :

 
Sélectionnez
SELECT ?g ?s ?p ?o
WHERE { 
	GRAPH ?g { ?s ?p ?o } 
}

?g est le graphe dans lequel on veut chercher nos résultats, et ?s ?p ?o le triplet sujet-prédicat-objet d'une requête SPARQL classique. Ainsi, en reprenant la requête SPARQL donnée dans la partie SPARQL de cette FAQ :

 
Sélectionnez
SELECT ?x WHERE {
    ?x <http://www.w3.org/2001/vcard-rdf/3.0#FN> "John Smith" .
}

Il est possible de la modifier afin d'intérroger uniquement les données d'un graphe (en l'occurence le graphe ?g, remplaçable pas l'URI du graphe souhaité) :

 
Sélectionnez
SELECT ?x WHERE {
GRAPH ?g {?x <http://www.w3.org/2001/vcard-rdf/3.0#FN> "John Smith" .}
}

De même il existe d'autres langages dont la forme est assez proche, comme le TriQL pour les données au format TriG ou encore le RDFQ.

Créé le 2013-06-16  par Pandapi

Lien : SPARQL FROM NAMED
Lien : Graphe nommés

précédentsommaire
 
 
  

Copyright © 2010-2012 developpez Developpez LLC. Tous droits réservés Developpez LLC. Aucune reproduction, même partielle, ne peut être faite de ce site ni de l'ensemble de son contenu : textes, documents et images sans l'autorisation expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.