Web Sémantique

ReperePointDepart

PagePrincipale :: DerniersChangements :: DerniersCommentaires :: ParametresUtilisateur :: Vous êtes 38.103.63.18

Le web sémantique, origine et perspective



La notion de « web sémantique » peut être abordée sous divers angles : son invention ou origine, sa raison d'être, sa réalité concrète, ses potentiels, etc.
Ici et maintenant, il est judicieux de se réunir autour du foyer central de cette notion, après un bref rappel des conditions de sa naissance.

Le temps du tissage


Le World Wide Web Consortium a travaillé durant des années au développement du réseau mondial par l'élaboration de normes centrées sur la présentation des contenus et leur proximité symbolique par les liens hypertextuels.
Ces normes même partiellement respectées ont permis rapidement l'accès performant de tout internaute à un volume d'informations toujours croissant, mettant aussitôt en évidence un déficit de maîtrise des contenus en raison même de leur volume.

Le World Wide Web est ainsi à la fois la base et la raison du Web Sémantique.

« The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in coopération ». Tim Berneers-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001.

Les acteurs du consortium ont donc déplacé les objectifs de standardisation de la perspective du rapprochement pratique des informations vers celle de leur distinction comme possibilité de toutes sortes de discriminations informatiques et humaines.
Après l'implantation planétaire de la famille HTML, la famille XML cherche à se faire une place, celle-ci étant elle-même propice à des normes encore plus éloignées du HTML tel que RDF.

Le temps du démêlage


Aujourd'hui, la notion de web sémantique est utile et pertinente parce que l'accès discriminé aux données constitue une longue perspective au cheminement incertain et ambitieux en comparaison de la relative facilité du succès quantitatif du premier web et au regard des faibles retombées de cet effort qui n'en est qu'à ses débuts.

Parler de web sémantique, c'est supposer un potentiel extrêmement prometteur centré sur les possibilités de maîtrise des contenus.
Ainsi, il faut souligner avant tout approfondissement que la problématique porte avant tout sur le web lui-même bien plus que sur le sémantique, terme abstrait susceptible d'être remplacé par beaucoup d'autres en fonction de son interprétation. Si la toile s'est embrouillée ou si le web s'est opacifié par son propre développement, l'exigence sémantique désigne confusément les possibilités de lui conférer à nouveau de la transparence et pour les plus optimistes de la lumière .

Finalement toute l'utilité du mot sémantique est de souligner qu'étant donné le caractère essentiellement textuel des documents, les progrès du World Wide Web doivent nécessairement passer par des formes d'affranchissement et de maîtrise des contraintes des langues ou de leurs usages ; aussi plusieurs disciplines ayant acquis une longue expérience de ces problèmes sont-elles mobilisées dans la poursuite de cet objectif commun.

La raison d'être du site est d'être une plateforme commune d'exploration des différentes pistes ouvertes à partir de ce constat initial.


Les premières esquisses d'un méta-web !

Alors que les derniers phares sont abandonnés à l'électronique, se dessinent les bases de nouveaux sémaphores symboliques !

La progressive dissipation de l'ombre au coeur du langage laisse entrevoir un jour sans crépuscule où les demandes d'information seront exaucées à peine formulées.

1. Les premiers efforts se sont naturellement attaqués aux multiples ombres relevant de l'ambiguïté des langages naturels ; ambiguïté à peu près surmontée par les hommes mais très handicapante pour les machines.
Ainsi entre l'analogique humain et le langage binaire, s'édifient des référentiels hybrides servant d'espace de conciliation des deux ordres de contrainte.
Ces nouveaux sémaphores (signes+porteur) se constituent de collections d'éléments de référence : adresses, balises, métadonnées, sujets identifiés et autres glossaires spécifiques ; toutes formes de "points sur les i" propres à libérer le vrai potentiel des processeurs et des algorithmes.
Une fois établies toutes ces formes de passerelles, les machines se chargeraient seules de s'accorder sur le contenu de toute interrogation et de sélectionner les meilleures réponses. On renoue ici avec les promesses théoriques de l'intelligence artificielle.

2. A peine répertoriées les obscurités de l'ambigu, que la dissipation de celles de l'implicite ou du conceptuel n'en apparaît que plus prometteuse encore, essentiellement en termes de fécondité intellectuelle. La synergie tendue dans un premier temps vers l'univocité de la communication appelle et favorise la synergie orientée vers l'explicitation maximale de ses contenus.
Aux enjeux pratiques rapidement évoqués ci-dessus d'un universalisme d'ordre relationnel "homme-machine", s'ajoutent encore ceux de la perspective d'un universalisme conceptuel ou "d'une ontologie de référence" (disciplinaire-culturel-générationnel).

Il s'agit d'horizons lointains et tout cela reste bien théorique, mais le web sémantique étant à lui-même son propre moyen, il est l'outil toujours améliorable de capitalisation et de convergence des efforts individuels vers un web sémantique réalisé.


Pour une part, cette section méta-web tente de compléter ce qui la précède en matière de "dialogue des machines" ; insuffisance soulignée par Jean-Pierre Legrand ci-dessous.

De même, pour pallier la trop grande abstraction de ces considérations, je propose de se pencher sur le berceau du néologisme "métadonisation" :
Métadonisation : substitution d'un produit naturel par un cocktail d'éléments extraits de la panacée ; cocktail permettant aux ordinateurs de se faire une idée de ce que les hommes vivent...

--[HerveTigier]



Le temps où on laisse les ordinateurs se demerder tout seuls


Si ma mémoire est bonne, il y a une dimension forte de l'idée de Tim Berneers-Lee qui mérite d'être particulièrement soulignée. Ce zoom n'enlève rien à la pertinence des propos de Hervé. Le WEB que nous connaissons est avant tout très bête, lui et, par conséquence, les moteurs de recherche qui parcourent son contenu travaillent sur un gigantesque ramassis d'octets dépourvu de sens et tout juste structuré selon une syntaxe langago-dépendante. Par exemple : si sur votre Google préféré, vous lancez une requète sur les mots : Windows et Gates, vous obtenez en première ligne le site (www.edenhardware.co.nz/ ) d'un noble fabriquant de portes et fenêtres et non celui de Microsoft et de son vénéré patron.... le sens (la sémantique) (de quelle "Windows" voulez-vous parler?), c'est vous qui la donnez en fatiguant vos petits yeux sur un écran 17" au lieu d'aller les fatiguer sur l'écran 16*9ème de la télé. Autre exemple: comment dire à un moteur de recherche : "Va me chercher chez les libraires du WEB une édition brochée de la "Critique de la raison pure" au meilleur prix !. Il ne sait pas faire, incapable de savoir si un site parle de livres ou des dernières sonneries d'un téléphone portable...

Elle est là l'idée de Tim Berneers-Lee, depuis le premier jour du WEB... Il faut que les PROGRAMMES dialoguent entre eux pour résoudre des problèmes sans que vous soyez sans arret obligé d'arbitrer pour que le machin ne s'égare pas !

Pour faire cela, il faut au moins que les objets du WEB (qui ne seraient plus nécessairement des sites) intègrent deux choses :
Ils doivent être capable d'échanger le dialogue suivant : "Parles-tu de livres ?" "Non ! la librairie, c'est deux serveurs plus loin !"
Ils doivent s'accorder sur la description sémantique des choses ! Un livre est sémantiquement décrit par un ensemble de méta-données.. titre, auteur, prix...
La suite du dialogue est "Aurais tu, ami serveur libraire (Toi que j'ai reconnu parce que tu parles de LIVRE et que nous savons tous les deux ce que c'est...), aurais tu dis-je, un livre dont l'instance de la méta-donnée TITRE serait "La critique de la raison pure" et dont l'instance de la méta-donnée AUTEUR serait : Kant (pour vérifier).... oui ? tu me le fais à combien dans l'instance de la méta-donnée PRIX... merci t'es trop cher !"

En un mot il faut qu'ils s'accordent sur l'ontologie d'un domaine ! (Ontologie : Science de ce qui est ! clair non ?)

Une fois cela fait, reste plus qu'à aller taquiner le goujon (ou autres) pendant que les ordinateurs bossent !

Y aurait-il des hics ?

Oui, bien sur ! plein ! A mon avis, le principal est le suivant... qui va faire l'ontologie des domaines ? hein ? Des humains !! Ben on est pas prêt d'avoir du Web Sémantique sur les domaines à concurence commerciale forte ....

Dans le domaine scientifique, il y a déjà des choses !

Dans le domaine du partenariat inter-entreprises ... pourquoi pas !

-- Jean-Pierre Legrand


Début de réponse ... sur le dialogue des machines

Mon essai pèche par trop de généralité, c'est en partie parce que j'ai voulu ouvrir autant que possible la problématique !

Je récapitule ici les observations de Jean Pierre, certainement largement partagées, pour cerner les compléments à ajouter ci-dessus ou ailleurs.

- Il faut que les programmes dialoguent entre eux . 1. J'avoue que je ne vois pas trop ce que ça veux dire : les programmes ce sont aussi des bits et il faut bien aussi arbitrer les éventuels dialogues, etc. 2. Surtout dès aujourd'hui, qu'est-ce qui empêche Google de prendre en compte les metatags et régler aussitôt le problème pour ne pas gêner un fabricant de fenêtres en le confondant avec Microsoft...

-Des objets du web doivent s'accorder sur des descriptions sémantiques et de préférence des ontologies C'est d'accord !

- Concernant l'exemple, il y a aussi beaucoup à dire :
Mais, si j'ignore le nom de l'ouvrage avec seulement l'idée que Kant devrait traiter de ce qui m'intéresse, sont-ce (!) ces méta-données qui vont m'être d'une aide quelconque pour me conseiller ?

Mais n'extrapolons pas davantage à partir d'un exemple !

Je conclus provisoirement : Mon texte n'insiste sans doute pas assez sur les possibilités d'automatisation interactive. Mais je me demande si ce n'est pas l'arbre qui cache la forêt des efforts à faire pour ce que j'appelle la transparence et si je me trompe alors le web sémantique ou plus exactement participer à son développement ne m'intéresse pas ! Cela dit je reconnais que je ne suis pas très branché e-commerce ou e-faire juste un peu mieux ce qu'on fait hors du web ! Il faut que je me soigne !

Merci Jean Pierre de votre opinion, je vais essayer de m'en rapprocher dans mes futures éventuelles contributions !

--[HerveTigier]
Section méta-web ajoutée depuis.



Amine


Il n'y a pas de commentaire sur cette page. [Afficher commentaires/formulaire]