La FAQ sur le Web sémantique
La FAQ sur le Web sémantiqueConsultez toutes les FAQ
Nombre d'auteurs : 8, nombre de questions : 42, dernière mise à jour : 16 juin 2021Â
Le RDF (Resource Description Framework) est un framework qui permet de décrire les ressources contenues sur Internet, comme un site Web et son contenu. Une description RDF (ces descriptions sont souvent désignées comme des métadonnées ou « données sur les données ») peut inclure les auteurs de la ressource, une date de création ou de mise à jour, l'organisation des pages d'un site (sitemap), des informations qui décrivent le contenu en termes d'audience ou de classement des contenus, des mots-clés pour les moteurs de recherche, les catégories de divers sujets et ainsi de suite.
Avec le RDF, il est possible pour tout le monde de partager son site Web et d'autres descriptions plus facilement et, pour les développeurs, de construire des produits qui peuvent utiliser les métadonnées pour fournir des moteurs de recherche de meilleure qualité, d'agir comme des agents intelligents et de donner aux utilisateurs du Web plus de contrôle sur ce qu'ils consultent et publient.
Le RDF se présente sous la forme d'un triplet (sujet, prédicat, objet). Le sujet correspond à un concept, le prédicat à une relation et l'objet à un autre concept. Ainsi, avec ce format, on peut facilement indiquer qui est en relation avec quoi. Par exemple, dans « François mange un bonbon », le sujet est « François », le prédicat « mange » et l'objet « bonbon ».
Lien : Introduction
au RDF et à l'API RDF de Jena
Lien : RDF
Primer
Il existe plusieurs façons de définir des triplets RDF, chacune a ses avantages et ses inconvénients. Il y a le format RDF/XML, qui prend sa syntaxe de XML, donc lisible mais aussi très verbeux. Il y a aussi JSON-LD, basé sur JSON, moins verbeux et tout aussi lisible, qui va devenir lui aussi un standard. Ensuite, N-Triples, la plus simple mais prend énormément de volume : elle consiste à écrire un simple triplet avec ses composants se finissant par un point, de la forme <sujet> <prédicat> <objet> .. Finalement, Turtle (Terse RDF Triple Language), une notation pratique pour les triplets, qui commence d'ailleurs à s'imposer auprès des usagers qui souhaitent la standardiser, c'est une version simplifiée de N3 (Notation 3) qui est, lui, une façon très évoluée d'écrire ses triplets et de pouvoir décrire, entre autres, des règles sur les triplets.
Lien : Qu'est-ce que RDF ?
Lien : JSON-LD
Lien : N-Triples
Lien : Notation3
Lien : Turtle
Lien : RDF
Primer
Avant toute chose, il vaut mieux préférer stocker ses triplets RDF dans un magasin de triplets plutôt que dans un fichier RDF, car cette dernière méthode a un gros inconvénient : pour l'interroger, il faut passer par une application. Alors que, si vos triplets sont stockés dans un magasin, on peut y accéder de n'importe où et sans obligation de passer par une application.
Ainsi, pour interroger des données, on passe par un point d'accès SPARQL avec des requêtes SPARQL et ces requêtes renvoient les résultats dans le format RDF souhaité.
Lien : Le
tutoriel SPARQL
Lien : Introduction
au RDF et à l'API RDF de Jena
Lien : SPARQL
Query Language for RDF
Le plus souvent, lorsque l'on commence à vouloir publier des données sur le Web sémantique, on a déjà une base de données à disposition contenant toutes ces données. Et, pour que ces données soient mises sur le Web sémantique, il faut les traduire en triplets RDF. Il existe plusieurs méthodes, mais la plus utilisée est la suivante.
D2R (Database To RDF) a pour but de traduire toutes les données contenues dans une base de données en triplets RDF. Il fonctionne avec un fichier de mapping et une ou plusieurs ontologies. Le fichier de mapping sert à faire la liaison entre les tables et les champs contenus dans ces tables et les classes et les propriétés dont sont composées la ou les ontologies que l'on utilise.
Ainsi, après le mapping, les données correspondront à la ou les ontologies spécifiées et, ensuite, seront disponibles sur le Web sémantique par l'intermédiaire d'une interface Web et d'un point d'accès SPARQL.
Il existe maintenant deux standards pour mapper une base de données, R2RML et Direct Mapping. Ainsi avec ces deux standards il est possible d'intégrer toutes les données d'une base SQL au Web de données, de les manipuler avec SPARQL et de les interconnecter avec d'autres jeux de données présents sur le Web de données.
Lien : D2R
Lien : Direct
Mapping
Lien : R2RML