Dans la perspective d'un web sémantique, les choses doivent être clairement identifiées, sans quoi il n'est pas possible de partager l'information.
La notion de personne fournit un bon exemple : il existe par exemple des dizaines de François Martin en France ; comment décrire l'un d'eux sur le web, sans risquer de le confondre avec d'autres. La solution proposée par le web sémantique est d'associer un identifiant unique à chaque chose : il s'agit de l'URI (Uniform Resource Identifiers).
L'URI a fait l'objet de plusieurs spécifications ; la dernière en date synthétise, précise et remplace les précédentes : la
RFC 3986 de janvier 2005.
Quelques faits :
- Une URI vous permet d'identifier une chose (on parle d'une "ressource") avec certitude, de manière unique
- L'unicité est vitale pour faire en sorte que les déclarations soient cohérentes :
- en language naturel, on peut dire :
- <Charles De Gaulle> <est> <un homme>
- et <Charles De Gaulle> <est> <un porte avion>
- mais les informations implicites données par le contexte ne permettent pas, sur internet, d'automatiser des traitements ;
- dans le web sémantique il faut donc écrire, par exemple (il existe d'autres solutions) :
- tout le monde peut créer n'importe quelles métadonnées sur n'importe quelle ressource s'il connaît son URI
- il est possible d'agréger des métadonnées venant d'endroits différents sur une même ressource : cela est rendu possible parce qu'elles réfèrent à la même URI
Choix d'une URL comme URI
L'URL peut être choisie comme URI mais elle n'en conserve pas moins ses propriétés "techniques" d'URL classique. Ainsi, une URL peut être :
Le nom d'une URL est totalement arbitraire et ne dépend pas du document que l'URL localise ou bien de la chose qu'elle décrit. Ainsi :
- http://tel-site.org/Montaigne peut être le lieu de classement d'un doc sur Montaigne
- http://tel-site.org/Montaigne peut être le lieu de classement d'un doc sur Descartes
- http://tel-site.org/Montaigne peut être la référence de l'individu Michel de Montaigne
- http://tel-site.org/Montaigne peut être la référence de l'individu René Descartes
- http://tel-site.org/Montaigne peut être la référence du lieu de classement d'un doc sur Montaigne
- http://tel-site.org/Montaigne peut être la référence du lieu de classement d'un doc sur Descartes
- Une Url référence peut être aussi la localisation d'un document.
- Une url référence ne peut être la référence que d'une seule chose à la fois.
- Une url localisation ne peut localiser qu'un seul document à la fois.
- En revanche, à un lieu de classement sur Montaigne, peut correspondre 4 types de références :
- la référence du sujet de la fiche (Montaigne dans notre cas)
- la référence d'un autre sujet : on ne voit guère d'application à çà mais cela est possible
- la référence du (ou des ?) lieu de classement d'un (ou de) documents relatifs au sujet
- la référence du (ou des ?) lieu de classement d'un (ou de) documents relatifs à un autre sujet
Avantages de l'url par rapport à l'URN
- les noms de domaines pouvant être acheté, l'utilisateur peut avoir la maitrise d'un nom de domaine en tant que lieu de publication
- il existe de nombreux outils permettant de gérer les URL : validateur de syntaxe
- création manuelle simple : l'URL est une technique très connue et répandue
- une URL-référence peut aussi localiser un document relatif à la référence (fonctionnellement il s'agirait plutôt d'un inconvénient)
Inconvénients de l'url par rapport à l'URN
- confusion sémantique entre lieu et référence
Choix de l'URN comme URI
Les URN sont définies par la
RFC 2141 (interwiki) [en].
URN signifie
Uniform Resource Names. Les URNs sont des URIs, mais ils ne se rapportent pas à un document sur le web ni ailleurs. Un URN ressemble à ceci : urn:mon-schema:un-identifiant.
Exemples :
- urn:dc:montaigne
- urn:ietf:rfc:2141
- URN:ISBN:0-395-36341-1
Les schemas d'URNs doivent être validés par l'IETF pour devenir standards.
Choix du "Tag URI" comme URI
http://www.xml.com/pub/a/2004/10/13/hackcongress.html
http://www.taguri.org/
[à compléter]
Exemples :
- tag:websemantique.org,2005-04-25:De_Gaulle,Charles
Références
- La crise d'identité du web, par Claude Chiaramonti (2003). Où l'auteur s'interroge sur l'identité des objets sur le web et arguant qu'"il faut être d'accord sur ce qui peut avoir une telle URI ! S'agit-il d'identifier des objets du monde réel eux-mêmes ou, simplement, de donner l'adresse de pages Web décrivant ces objets ?".
- Qui suis-je ? Une URI [fr], par KarlDubost (04/03/2004).
- Sémantique Web: URI, talon d'achille ? [fr], par KarlDubost (02/10/2003).
- On Resources [en], par Tim Bray (07/2003).
- HashVsSlash [en], de l'utilisation de la barre oblique (slash) ou du dièse (hash) à la fin d'une URI : synthèse des débats.
- Four Uses of a URL: Name, Concept, Web Location and Document Instance [en], par David Booth (28/01/2003).
- Stuck in the Senate [en], par Paul Ford (13/10/2004).
- Tag URI scheme [en].
- L'IETF publie plusieurs RFCs à propos des URNs [fr], par Simon Saint-Laurent.
- Uniform Resource Identifier (URI) SCHEMES [en] : liste de tous les schemas d'URI, standards officiels de l'IETF.
- URN, sur l'encyclopédie Wikipédia.
Discussions
Note : Il y a un grand débat sur la "signification" des URI. En RDF il n'y a pas moyen de faire la différence entre la "ressource humaine" (Charles de Gaulle, le personnage historique) et la "ressource informatique" (ce qui se trouve à
http://example.org/Hommes/CharlesDeGaulle) ce qui peut entraîner bien des confusions.
- La norme TopicMaps permet de faire cette distinction en utilisant la ressource identifiée par une URI, soit comme "indiquant" un sujet (la ressource humaine), soit comme "constituant" le sujet (la ressource informatique).
BernardVatant