Web Sémantique

TexteWebSemantiqueOuWebAnalytique

PagePrincipale :: DerniersChangements :: DerniersCommentaires :: ParametresUtilisateur :: Vous êtes 38.107.191.102

Web sémantique ou web analytique !

par Hervé Tigier


Imaginons un instant que seulement la moitié des pages web se présentent comme des fiches signalétiques, aurions-nous toujours le besoin ou le désir d'un web sémantique ? Le rôle central des indexeurs seraient de nous fournir des listes abrégées des champs renseignés et nous saurions bien les exploiter naturellement ou plus ou moins méthodiquement. Dans une perspective phénoménologique, les présentes lignes développent l'idée d'un web analytique, reposant sur de l'information structurée.
La seconde interrogation entrelacée avec la question de fond est de savoir si ce web analytique ne serait au mieux qu'une voie vers le web sémantique ou si par la qualité de sa mise en oeuvre, il ne pourrait pas finalement satisfaire l'essentiel des bons offices espérés du web sémantique. Avant de rentrer dans le coeur du sujet, précisons que toute référence aux normes et vocabulaires techniques du web a été volontairement évitée pour rester au plus près de l'abstraction des hypothèses proposées.

Point de départ : Le principe de l'accès au sens par la structure ou (masse, structuration, intérêt)


Ce triplet est ici l'axiome fondamental de l'accessibilité des contenus. Ne jamais le perdre de vue pourrait éviter d'investir dans des développements irréalistes et appelant souvent d'autres développements qui le sont guère moins.
La question est donc : La structuration n'est-elle pas le concept-clé d'un web exploitable, quelles que soient les formes concrètes que prend cette structuration ?
Avec les mêmes critères de rusticité, ce qui suit essaye de développer cette idée au plus près des acteurs du web dans leurs conditions de travail en mode production comme en mode consommation.

La condition de base : (document, structuration, données)


Toutes les intelligences ne fonctionnent pas de la même manière, mais un repérage aisé n'est-il pas l'étape incontournable vers la compréhension du contenu ou du signifié ? C'est en tout cas avec cette valeur d'antichambre propice à la réception du contenu qu'est appréhendée ici la notion de structure.
Ainsi considérée la structure est une des dimensions majeures de la ressource et l'analyse n'est plus abandonnée aux seules capacités humaines et automatiques ultérieures.
Les instruments de recherche sont soulagés de la question de la levée d'ambiguïté ; ils peuvent s'orienter résolument vers la valorisation des analyses primitives.

Cet axiome et cette condition de base sont une base de lancement qui appelle surtout un consensus sans avoir d'autre intérêt en eux-mêmes. Ensuite vient le temps des hypothèses de mises en oeuvre envisageables dans le long terme.

La situation idéale de genèse d'un web analytique : (document, structuration, analyse native)


Avant toute chose, la conception du document anticipe son intégration au réseau en cherchant la réduction de son opacité, c'est-à-dire de son ambiguïté.
Non seulement, l'analyse ainsi conçue est incluse dans la construction du document, mais elle constitue l'axe même de sa rédaction ; axe réutilisable pour tout document apparenté.
A rebours de la linéarité et discursivité de la communication actuelle, tout effort de structuration explicite des contenus devrait être une assurance d'une diffusion optimale et pérenne.
Par-delà les intérêts pratiques ou méthodiques de cette démarche, l'aspect élémentaire de l'intrication native de l'analyse et des données semble un appui solide – comme indépassable - dans la perspective du progrès qualitatif du web. D'ailleurs, sur le fond, cette démarche une fois systématisée s'apparente fortement à celle de la construction des ontologies.

La structuration comme espace commun entre les conditions de rédaction, les données et la communication ...


Comme promis, il convient au préalable de s'interroger sur la plausibilité de cette orientation des énergies tout à la fois pragmatique et ambitieuse.
Face aux grandes facilités et libertés actuelles de création d'information, l'émergence de démarches autocontraintes visant une structuration des documents semble une utopie. Cependant plusieurs facteurs permettent de croire à cette évolution sur la longue durée. Certains sont des débuts de réponses aux difficultés de décollage du web sémantique ou plus exactement aux doutes souvent légitimes dont il est l'objet :


Enfin, il faudrait mesurer les progrès réalisés non pas à l'aune de durées de visite, de nombres de pages visitées, de volumes d'octets circulants, etc, mais du profit réel retiré par l'usager pour le temps ou la peine dépensée.

Principes d'une chaîne de diffusion en cinq points


Essai de répartition des rôles :

1. le producteur se restreint à une ou quelques collections de mots-clés : individus ; voyages ; bâtiments...
2. le producteur structure son site et ses pages autour de ces mots-clés primaires...
3. un intégrateur recherche automatiquement les sites fédérateurs concernés par ces collections...
4. les sites fédérateurs concernés analysent le site sur la base des mots-clés et tissent des liens de qualité avec lui...
5. l'usager utilise par défaut n'importe quel site fédérateur pour l'orienter vers l'information la plus qualifiée, de solides passerelles reliant les sites fédérateurs spécialisés.

Précisions de mise en oeuvre :

Sur 1 : un mot-clé est considéré comme primaire et ainsi recevable pour un site fédérateur s'il implique des sous-clés ou clés secondaires, voire tertiaires, qui seront recherchés automatiquement par le site fédérateur. L'insuffisance de mots-clés secondaires dans un document sera avant tout un critère péjoratif concernant la valeur de l'information, tant pour l'humain que pour les robots.
Sur 2 : les mots-clés primaires seront utilisés comme des balises encadrant le coeur de l'information produite, elle-même articulée autour de mots-clés internes non fournis au site fédérateur mais détectables par lui.
Sur 3 et 4 : la vocation d'un site fédérateur est de rapprocher de son ontologie le contenu du site et créer des liens pertinents entre ontologie et contenu. L'intégrateur n'est que l'intermédiaire provisoire. Il est aussi temporaire au sens où la notoriété de sites fédérateurs permettra un « référencement » direct.
Sur 4 : les sites fédérateurs comme pôles d'intelligence collective auront naturellement un rôle de guidage des structurations des ressources en rapport avec leur ontologie, ce rôle restant non-directif.
Sur 5 : comme dans le système actuel, l'usager doit faire au moins deux choix : celui de son mot-clé (le cas habituel) et celui d'un site (fédérateur). La possibilité de choisir d'abord uniquement le mot-clé suppose une forte cohésion des sites fédérateurs pour que l'offre complète lui soit proposée. Dans cette attente, l'intégrateur pourra jouer ce rôle d'aiguillage.

Avantages :
Pour le producteur : liberté de choix de ses mots-clés primaires ; obligation de référencement limitée à ces mots-clés ; incitation à une consolidation de la structuration.
Pour l'usager : liberté encadrée dans sa recherche ; meilleure efficacité de la recherche ; continuité entre sites fédérés d'une part et le site fédérateur d'autre part ; multiples services ajoutés liés au principe du site fédérateur.

Avantages généraux :

1. Les documents deviennent lisibles par les machines en restant lisibles par les humains.
2. L'effort général reste avant tout un effort d'analyse, potentiellement collectif de surcroît ; les mises en oeuvres concrètes ne bousculent pas les habitudes et peuvent être néanmoins rapidement valorisées, assurant ainsi une transition douce entre le web anarchique et le web sémantique.

Inconvénients

Le système repose sur la valeur de sites fédérateurs, c'est-à-dire leur capacité à jouer tout leur rôle d'objectivation de manière fiable et durable. L'établissement à terme d'ontologies largement reconnues est la condition majeure de réussite, même s'il faut compter sur la fusion progressive d'ontologies restreintes.

Il conviendrait pour terminer cette analyse de donner l'exemple en donnant des exemples élémentaires de conception de contenus structurés à l'aide des outils disponibles. Mais cela tendrait à faire oublier qu'au-delà des mises en oeuvre possibles à des degrés divers, il est avant tout question ici de la vraisemblance d'une translation progressive des habitudes des acteurs du web vers des réflexes de structuration simple et efficace... Beaucoup, essentiellement professionnels, vivent naturellement dans ce paradigme ; la réussite d'un réseau universel viable passe peut-être par sa généralisation de proche en proche.

--HerveTigier


Il n'y a pas de commentaire sur cette page. [Afficher commentaires/formulaire]